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NOUVELLE SOUCHE DE CORONAVIRUS ASSOCIE AU SRAS ET SES 

APPLICATIONS 

La pr^sente invention est relative h une nouvelle souche de corona- 
virus associe au syndrome respiratoire aigu severe (SRAS), issue d'un pr61£vement 
5 nSpertorie sous le n° 031589 et prelev<§ a Hanoi (Vietnam), a des molecules d'acide 
nucteique issues de son genome, aux proteines et peptides codes par lesdites 
molecules d-acide nucl&que ainsi qu'a leurs applications, notamment en tant que reac- 
tifs de diagnostic et/ou comme vaccin. 

Le coronavirus est un virus a ARN monocatSnaire, de polarity posi- 
10 tive, d'approximativement 30 kilobases qui se replique dans le cytoplasme des cellules 
hotes ; l'extremitS 5' du g&iome a une structure en coiffe et l'extremite 3' comporte 
une queue polyA. Ce virus est enveloppe et comprend, k sa surface, des structures 
p6plom6riques d6nomm6es spicules. 

Le genome comprend les cadres ouverts de lecture ou ORF suivants, 
15 de son extremite 5' vers son extr&nit6 3' : ORF la et ORF lb correspondant aux 
prolines du complexe de transcription-replication, et ORF-S, ORF-E, ORF-M et 
ORF-N correspondant aux prolines structurales S, E, M et N. II comprend <5galement 
des ORFs correspondant a des prolines de fonction inconnue codees par : la region 
situete entre l'ORF-S et l'ORF-E et chevauchant cette derniere, la region situee entre 
20 1' ORF-M et l'ORF-N, et la region incluse dans l'ORF-N. 

La proline S est une glycoproteine membranaire (200-220 kDa) qui 
se prdsente sous la forme de spicules ou "Spike" gmergeant de la surface de 
Tenveloppe virale. Elle est responsable de l'attachement du virus aux recepteurs de la 
cellule hote et de Pinduction de la fusion de l'enveloppe virale avec la membrane 
25 cellulaire. 

La petite proline d'enveloppe (E) ggalement d6nomm6e sM (small 
membrane) qui est une proline trans-membranaire non glycosylee d'environ 10 kDa, 
est la proline pr6sente en plus faible quantite dans le virion. Elle joue un role moteur 
dans le processus de bourgeonnement des coronavirus qui se produit au niveau du 
30 compartiment intermediate dans le reticulum endoplasmique et Tappareil de Golgi 

La proline M ou proteine de matrice (25-30 kDa) est une glyco- 
proteine membranaire plus abondante qui est integree dans la particule virale par une 
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interaction M/E, tandis que V incorporation de S dans les particules est dirigSe par une 
interaction S/M.> Elle semble etre importante pour la maturation virale des coronavirus 
et pour la determination du site au niveau duquel les particules virales sont assem- 
blies. 

5 La proteine N ou proteine de nucieocapside (45-50 kDa) qui est la 

plus conserve parmi les proteines structurales des coronavirus, est n<£cessaire pour 
encapsider TARN ginomique puis pour diriger son incorporation dans le virion. Cette 
proline est vraisemblablement egalement impliquie dans la replication de TARN. 

Lorsqu'une cellule hote est infectee, le cadre de lecture (ORF) situe 

10 en 5' du genome viral est traduit en une polyprot&ne qui est clivee par les proteases 
virales et libere alors plusieurs proteines non-structurales telles que l'ARN- 
polymerase ARN dSpendante (Rep) et 1' ATPase helicase (Hel). Ces deux proteines 
sont impliqu6es dans la replication du genome viral ainsi que dans la generation de 
transcrits qui sont utilises dans la synthase des proteines virales. Les mecanismes par 

15 lesquels ces ARNms sub-genomiques sont produits, ne sont pas completement 
cpmpris ; cependant des faits recents indiquent que les sequences de regulation de la 
transcription a l'extremite 5' de chaque gene represented des signaux qui regulent la 
transcription discontinue des ARNms sub-genomiques. 

Les proteines de la membrane virale (proteines S, E et M) sont inse- 

20 rees dans le compartiment intermediate, alors que 1' ARN replique (brin +) s'assemble 
avec la proteine N (nucieocapside). Ce complexe proteine-ARN s'associe ensuite avec 
la proteine M incluse dans les membranes du reticulum endoplasmique et les 
particules virales se forment lorsque le complexe de la nucieocapside bourgeonne dans 
le reticulum endoplasmique. Le virus migre ensuite k travers le complexe du Golgi et 

25 eventuellement sort de la cellule, par exemple par exocytose. Le site de Pattachement 
du virus k la cellule h6te se trouve au niveau de la proteine S. 

Les coronavirus sont responsables de 15 k 30 % des rhumes chez 
1'Homme et d'infections respiratoires ou digestives chez les animaux, notamment le 
chat (FIPV : Feline infectious peritonitis virus), la volaille (IBV : Avian Infectious 

30 bronchitis virus), la souris (MHV : Mouse Hepatitis virus), le pore (TGEV : 
Transmissible gastroenterititis virus, PEDV : Porcine Epidemic Diarrhea virus, 
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PRCoV: Porcine Respiratory Coronavirus, HEV : Hemagglutinating encephalo- 
myelitis Virus) et les bovins (BcoV : Bovine coronavirus). 

En general, chaque coronavirus n'affecte qu'une seule espece ; chez 
les individus immunocompetents, l'infection induit des anticorps 6ventuellement 

5 neutralisants et une immunite cellulaire, capables de detruire les cellules infectees. 

Une epid&nie de pneumonie atypique, d6nommee syndrome respi- 
ratoire aigu severe (SARS ou Severe acute respiratory syndrome, SRAS en francais) 
s'est propagee dans differents pays (Vietnam, Hong-Kong, Singapour, Thailande et 
Canada) au cours du premier trimestre 2003, a partir d'un foyer initial apparu en 

10 Chine dans le dernier trimestre de 2002. La seventh de cette maladie est telle que son 
taux de mortalite est d'environ 3 a 6 %. La determination de l'agent causatif de cette 
maladie a 6t6 entreprise par de nombreux laboratoires, a travers le monde. 

En mars 2003, un nouveau coronavirus (SARS-CoV, SARS virus ou 
virus SRAS, en francais) a 6t6 isol6, en association avec des cas de syndrome respi- 

15 ratoire aigu severe (T.G.KSIAZEK et al., The New England Journal of Medicine, 
2003, 348, 1319-1330 ; C. DROSTEN et al., The New England Journal of Medicine, 
2003, 348, 1967-1976 ; Peiris et al., Lancet, 2003, 361, 13 19-). 

Des sequences genomiques de ce nouveau coronavirus ont ainsi 6t6 
obtenues, notamment celles de l'isolat Urbani (Genbank n° d'acces AY274119.3 et A. 

20 MARRA et al., Science, May 1, 2003, 300, 1399-1404) et de l'isolat de Toronto 
(Tor2, Genbank n° d'acces AY 278741 et A. ROTA et al., Science, 2003, 300, 1394- 
1399). 

L'organisation du genome est comparable a celle des autres corona- 
virus connus permettant ainsi de confirmer rappartenance du SARS-CoV a la famille 

25 des Coronaviridae ; les cadres ouverts de lecture ORFla et lb et les cadres ouverts de 
lecture correspondant aux prolines S, E, M, et N, ainsi qu'a des prolines codees par : 
la region situee entre l'ORF-S et l'ORF-E (ORF3), la region situee entre i'ORF-S et 
l'ORF-E et chevauchant l'ORF-E (ORF4), la region situee entre l'ORF-M et l'ORF-N 
(ORF7 a ORF11) et la region correspondant a l'ORF-N (ORF13 et ORF14), ont 

30 notamment et6 identifies. 

Sept differences ont 6t6 mises en 6vidence entre les sequences des 
isolats Tor2 et Urbani ; 3 correspondent a des mutations silencieuses (c/t en position 
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16622 et a/g en position 19064 de PORFlb, t/c en position 24872 de PORF-S) et 4 
modifient la sequence en acides amines de respectivement : les prolines codees par 
TORFla (c/t en position 7919 correspondant k la mutation A/V), la proteine S (g/t en 
position 23220 correspondant k la mutation A/S), la proline codee par PORF3 (a/g en 
5 position 25298 correspondant a la mutation R/G) et de la proline M (t/c en position 
26857 correspondant a la mutation S/P). 

En outre, P analyse phylogenetique montre que le SARS-CoV est 
eloigne des autres coronavirus et qu'il est apparu, ni par mutation de coronavirus 
respiratoires humains, ni par recombinaison entre des coronavirus connus (pour une 

10 revue, voir Holmes, J.C.I., 2003, 111, 1605-1609). 

La mise en evidence et la prise en compte de nouveaux variants sont 
importantes pour la mise au point de reactifs de detection et de diagnostic du SRAS 
suffisamment sensibles et specifiques ainsi qu'a des compositions immunogenes aptes 
k proteger des populations contre des epid&nies de SRAS. 

15 Les Inventeurs ont maintenant mis en Evidence une autre souche de 

coronavirus assocte au SRAS, qui se distingue des isolats Tor2 et Urbani. 

La pr^sente invention a done pour objet, une souche isol£e ou puri- 
fi6e de coronavirus humain associe au syndrome respiratoire aigu severe, caracterisSe 
en ce que son genome pr^sente sous la forme d' ADN complementaire un codon serine 

20 en position 23220-23222 du gene de la proline S ou un codon glycine en position 
25298-25300 du gSne de PORF3, et un codon alanine en position 7918-7920 de 
l'ORFla ou un codon serine en position 26857-26859 du gdne de la proteine M, 
lesdites positions 6tant indiquees en reference a la sequence Genbank AY2741 19.3. 

Selon un mode de realisation avantageux de ladite souche, 

25 P Equivalent ADN de son g&iome presente une sequence correspondant k la sequence 
SEQ ID NO : 1 ; cette souche de coronavirus est issue du pr&tevement de lavage 
bronchoalv6olaire d'un patient atteint de SRAS, repertorte sous le n° 031589 et 
effectue a Phopital fran9ais de Hanoi (Vietnam). 

Conform&nent k V invention, ladite sequence SEQ ID NO :1 est 

30 celle de Pacide d6soxyribonucl£ique correspondant a la molecule d'acide ribo- 
nucleique du genome de la souche isolSe de coronavirus telle que d£finie ci-dessus. 
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La sequence SEQ ID NO : 1 se distingue de la sequence Genbank 
AY2741 19.3 (isolat Tor2) en ce qu'elle possdde les mutations suivantes : 

- g/t en position 23220 ; le codon alanine (get) en position 577 de la 
sequence en acides amines de la proline S de Tor2 est remplace par un codon serine 

5 (tct), 

- a/g en position 25298 ; le codon arginine (aga) en position 11 de la 
sequence en acide amines de la proteine codee par TORF3 de Tor 2 est remplace par 
un codon glycine (gga). 

En outre, la sequence SEQ ID NO : 1 se distingue de la sequence 
10 Genbank AY278741 (isolat Urbani) en ce qu'elle possede les mutations suivantes : 

- t/c en position 7919 ; le codon valine (gtt) en position 2552 de la 
sequence en acides amines de la proteine codee par l'ORFla est remplace par un 
codon alanine (get), 

- t/c en position 16622 : cette mutation ne modifie pas la sequence 
15 en acides amines des prolines codees par PORFlb (mutation silencieuse), 

- g/a en position 19064 : cette mutation ne modifie pas la sequence 
en acides amines des proteines codees par PORFlb (mutation silencieuse), 

- c/t en position 24872 : cette mutation ne modifie pas la sequence 
en acides amines de la proteine S, et 

20 - c/t en position 26857 : le codon proline (ccc) en position 154 de la 

sequence en acides amines de la proline M est remplace par un codon serine (tec). 

En V absence de mention particuliere, les positions des sequences 
nucleotidiques et peptidiques sont indiqu6es en reference a la sequence Genbank 
AY274119.3. 

25 La prSsente invention a egalement pour objet un polynucleotide isoie 

ou purifie, caracteris6 en ce que sa sequence est celle du genome de la souche isolee 
de coronavirus telle que definie ci-dessus. 

Selon un mode de realisation avantageux dudit polynucleotide il 
pr6sente la sequence SEQ ID NO : 1 . 

30 La presente invention a egalement pour objet un polynucleotide isoie 

ou purifie, caracterise en ce que sa sequence hybride dans des conditions de forte 
stringence avec la sequence du polynucleotide tel que defini ci-dessus. 
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Les termes « isole ou purifie » signifient modifie .« par la main de 
Thomme » k partir de l'etat naturel ; autrement dit si un objet existe dans la nature, il 
est dit isole ou purifie s'il a €t€ modifie ou extrait de son environnement naturel ou les 
deux. Par exemple, un polynucleotide ou une proteine/un peptide naturellement 
5 present dans un organisme vivant n'est ni isole, ni purifie ; en revanche le meme poly- 
nucleotide ou proteine /peptide separ6 des molecules coexistantes dans son environ- 
nement naturel, obtenu par clonage, amplification et/ou synthase chimique est isole au 
sens de la presente invention. De plus, un polynucleotide ou une proteine/peptide qui 
est introduit dans un organisme par transformation, manipulation gen£tique ou par 

10 toute autre methode, est « isole » meme s'il est present dans ledit organisme. Le terme 
purifie tel qu'utilise dans la presente invention, signifie que les proteines /peptides 
selon T invention sont essentiellement libres d' association avec les autres proteines ou 
polypeptides, comme Test par exemple le produit purifie de la culture de cellules 
hotes recombinantes ou le produit purifie a partir d'une source non-recombinante. 

15 Au sens de la presente invention, on entend par conditions d'hybri- 

dation de forte stringence, des conditions de temperature et de force ionique choisies 
de telle maniere qu ! elles permettent le maintien de Thybridation specifique et selective 
entre polynucleotides compiementaires. 

A titre d'illustration, des conditions de forte stringence aux fins de 

20 definir les polynucleotides ci-dessus 5 sont avantageusement les suivantes : l'hybrida- 
tion ADN-ADN ou ADN-ARN est realisee en deux etapes : (1) prehybridation a 42°C 
pendant 3 heures en tampon phosphate (20 mM pH 7,5) contenant 5 x SSC (1 x SSC 
correspond a une solution 0,15 M NaCl 4- 0, 015 M citrate de sodium), 50 % de 
formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x Denhardt f s, 5 % de dextran 

25 sulfate et 1 % d f ADN de sperme de saumon ; (2) hybridation pendant 20 heures a 
42°C suivie de 2 lavages de 20 minutes k 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 
minutes k 20°C en 0,1 x SSC + 0,1 % SDS. Le dernier lavage est pratique en 0,1 x 
SSC + 0,1 % SDS pendant 30 minutes k 60°C. 

La presente invention a egalement pour objet un fragment represen- 
30 tatif du polynucleotide tel que defini ci-dessus, caracterise en ce qu'il est susceptible 
d'etre obtenu, soit par l'utilisation d'enzymes de restriction dont les sites de recon- 
naissance et de coupure sont presents dans ledit polynucleotide tel que defini ci- 
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dessus, soit par amplification k Paide d'amorces oligonucieotidiques sp6cifiques dudit 
polynucleotide tel que defini ci-dessus, soit par transcription in vitro, soit par synthese 
chimique. 

Selon un mode de realisation avantageux dudit fragment, il est selec- 
5 tionne dans le groupe constitue par : PADNc correspondant a au moins un cadre 
ouvert de lecture (ORE) choisi parmi : ORFla, ORFlb, ORF-S, ORF-E, ORF-M, 
ORF-N, ORF3, ORF4, ORF7 k ORF11, ORF13 et ORF14, et PADNc correspondant 
aux extremes 5' ou 3' non-codantes dudit polynucleotide. 

Selon une disposition avantageuse de ce mode de realisation, ledit 
10 fragment presente une sequence selectionn^e dans le groupe constitue par : 

- les sequences SEQ ID NO : 2 et 4 representant PADNc corres- 
pondant a P ORF-S qui code pour la proline S, 

- les sequences SEQ ID NO : 13 et 15 representant PADNc corres- 
pondant k PORF-E qui code pour la proteine E, 

15 - les sequences sequence SEQ ID NO: 16 et 18 representant 

PADNc correspondant a PORF-M qui code pour la proteine M, 

- les sequences SEQ ID NO : 36 et 38 representant PADNc corres- 
pondant k P ORF-N qui code pour la proteine N, 

- les sequences representant les ADNc correspondant respective- 
20 ment : aux ORFla et ORFlb (ORFlab, SEQ ID NO : 31), aux ORF3 et ORF4 (SEQ 

ID NO : 7, 8), aux ORF 7 a 1 1 (SEQ ID NO : 19, 20), k PORF13 (SEQ ID NO : 32) et 

k PORF14 (SEQ ID NO : 34), et 

- les sequences representant les ADNc correspondant respectivement 

aux extremites 5'(SEQ ID NO : 39 et 72) et 3' non-codantes (SEQ ID NO : 40, 73) 
25 dudit polynucleotide. 

La presente invention a egalement pour objet un fragment de 

PADNc codant pour la proteine S, tel que defini ci-dessus, caracterise en ce qu'il 

presente une sequence seiectionnee dans le groupe constitue par les sequences SEQ ID 

NO : 5 et 6 (fragments Sa et Sb). 
30 La presente invention a egalement pour objet un fragment de 

PADNc correspondant aux ORFla et ORFlb tel que defini ci-dessus, caracterise en ce 

I 
i 
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qu'il presente une sequence seiectionnee dans le groupe constitue par les sequences 
SEQ ID NO : 41 a 54 (fragments L0 a L12). 

La presente invention a egalement pour objet un fragment du poly- 
nucleotide tel que defini ci dessus, caracterise en ce qu'il presente au moins 15 bases 
5 ou paires de bases cons^cutives de la sequence du genome de ladite souche incluant au 
moins une de celles situSes en position 7979, 16622, 19064, 23220, 24872, 25298 et 
26857. De preference, il s'agit d'un fragment de 20 k 2500 bases ou paires de bases, 
de maniere prefer^e de 20 k 400. 

Selon un mode de realisation avantageux dudit fragment, il inclut au 
10 moins un couple de bases ou de paires de bases correspondant aux positions 
suivantes : 7919 et 23220, 7919 et 25298, 16622 et 23220, 19064 et 23220, 16622 et 
25298, 19064 et 25298, 23220 et 24872, 23220 et 26857, 24872 et 25298, 25298 et 
26857. 

La presente invention a egalement pour objet des amorces d'au 
15 moins 18 bases aptes k amplifier un fragment du genome d'un coronavirus associe au 
SRAS ou de Tequivalent ADN de celui-ci. 

Selon un mode de realisation desdites amorces, elles sont selection- 
n£es dans le groupe constitue par : 

- la paire d' amorces n° 1 correspondant respectivement aux positions 
20 28507 k 28522 (amorce sens, SEQ ID NO : 60) et 28774 k 28759 (amorce anti-sens, 

SEQ ID NO : 61) de la sequence du polynucleotide tel que defini ci-dessus, 

- la paire d' amorces n° 2 correspondant respectivement aux positions 
28375 k 28390 (amorce sens, SEQ ID NO : 62) et 28702 a 28687 (amorce anti-sens, 
SEQ ID NO : 63) de la sequence du polynucleotide tel que defini ci-dessus., et 

25 - la paire d'amorces constituee des amorces SEQ ID Nos 55 et 56. 

La presente invention a egalement pour objet une sonde apte k 
detecter la presence du genome d'un coronavirus associe au SRAS ou d'un fragment 
de celui-ci, caracterisee en ce qu'elle est seiectionnee dans le groupe constitue par : les 
fragments tels que definis ci-dessus et les fragments correspondant aux positions 

30 suivantes de la sequence du polynucleotide tel que defini ci-dessus : 28561 a 28586, 
28588 a 28608, 28541 a 28563 et 28565 k 28589 (SEQ ID NO : 64 k 67). 
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Les sondes et amorces selon rinvention peuvent etre marquees 
directement ou indirectement par un compost radioactif ou non radioactif par des 
m6thodes bien connues de l'Homme du Metier, afin d'obtenir un signal detectable 
et/ou quantifiable. Parmi les isotopes radioactifs utilises, on peut citer le 32 P, le 33 P, le 

35 3 125 

5 S, le H ou 1' L Les entites non radioactives sont s^lectionnees parmi les ligands 
tels que la biotine, Tavidine, la streptavidine, la digoxygenine, les haptenes, les colo- 
rants, les agents luminescents tels que les agents radioluminescents, ch&nolumines- 
cents, bioluminescents, fluorescents, phosphorescents. 

L'invention englobe les sondes et les amorces marquees d^rivees des 
1 0 s6quences precedentes. 

De telles sondes et amorces sont utiles pour le diagnostic de 
Tinfection par un coronavirus associe au SRAS. 

La presente invention a egalement pour objet une methode de detec- 
tion d'un coronavirus associe au SRAS, k partir d'un echantillon biologique, laquelle 
15 methode est caracterisee en ce qu'elle comprend au moins : 

(a) P extraction d'acides nucleiques presents dans ledit echantillon 

biologique, 

(b) Pamplification d'un fragment de PORF-N par RT-PCR k Paide 
d'une paire d'amorces telle que definie ci-dessus, et 

20 (c) la detection par tout moyen approprie des produits 

d'amplifications obtenus en (b). 

Les produits d'amplifications (amplicons) en (b) sont de 268 pb pour 
la paire d'amorces n° 1 et de 328 pb pour la paire d'amorces n°2. 

Selon un mode de mise en oeuvre avantageux dudit procede, Petape 
25 (b) de detection est r£alis6e k Paide d'au moins une sonde correspondant aux positions 
28561 k 28586, 28588 k 28608, 28541 k 28563 et 28565 k 28589 de la sequence du 
polynucleotide tel que defini ci-dessus. 

De preference, le genome du coronavirus associe au SRAS est 
detecte et eventuellement quantifie par PCR en temps reel, a Paide de la paire 
30 d'amorces n°2 et des sondes correspondant aux positions 28541 a 28563 et 28565 a 
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28589 marquees avec des composes differents, notamment des agents fluoresceins 
differents. 

La RT-PCR en temps reel qui met en oeuvre cette paire d'amorces et 
cette sonde est tr&s sensible puisqu'elle permet de detecter 10 2 copies d'ARN et jusqu'a 
5 10 copies d'ARN, elle est en outre fiable et reproductible. 

L'invention englobe les polydesoxyribonucleotides et les polyribo- 
nucleotides simple-brin, double-brin et tripe-brin correspondant k la sequence du 
genome de la souche isotee de coronavirus et de ses fragments tels que definis ci- 
dessus, ainsi qu'& leurs sequences compiementaires, sens ou anti-sens, notamment les 
10 ARN et les ADNc correspondant a la sequence du genome et de ses fragments tels que 
definis ci-dessus. 

La pr6sente invention englobe egalement les fragments 
d' amplification obtenus a l'aide d'amorces sp6cifiques du genome de la souche puri- 
fiee ou isolee tel que defini ci-dessus, notamment a l'aide d'amorces et de paires 

15 d'amorces telles que definies ci-dessus, les fragments de restriction constituSs par ou 
comprenant la sequence des fragments tels que definis ci-dessus, les fragments obte- 
nus par transcription in vitro k partir d'un vecteur contenant la sequence SEQ ID NO : 
1 ou un fragment tel que defini ci-dessus, ainsi que des fragments obtenus par 
synthese chimique. Des exemples de fragments de restriction sont deduits de la carte 

20 de restriction de la sequence SEQ ID NO : 1 illustree par la figure 13. Conform&nent 
k l'invention lesdits fragments sont, soit sous forme de fragments isoles, soit sous 
forme de melanges de fragments. L'invention englobe egalement les fragments modi- 
fies, par rapport aux precedents, par enlevement, ou addition de nucleotides dans une 
proportion d'environ 15 %, par rapport k la longueur des fragments ci-dessus et/ou 

25 modifies au niveau de la nature des nucleotides, des lors que les fragments nucleo- 
tidiques modifies conservent une capacite d'hybridation avec les sequences d'ARN 
genomiques ou antigenomiques de l'isolat tel que defini ci-dessus. 

Les molecules d'acide nucieique selon l'invention sont obtenues par 
les methodes classiques, connues en elles-memes, en suivant les protocoles standards 

30 tels que ceux decrits dans Current Protocols in Molecular Biology (Frederick M. 
AUSUBEL,2000, Wiley and son Inc, Library of Congress, USA). Par exemple, eiles 



WO 2005/056584 



PCT/FR2004/003106 



11 

peuvent etre obtenues par amplification (Tune sequence nucleique par PCR ou RT- 
PCR ou bien par synthase chimique totale ou partielle. 

La pr6sente invention a egalement pour objet une puce ou filtre k 
ADN ou a ARN, caracteris6 en ce qu'il comprend au moins un polynucleotide ou Pun 
5 de ses fragments tels que definis ci-dessus. 

Les puces ou filtres k ADN ou a ARN selon Pinvention sont prepa- 
res par les methodes classiques, connues en elles-memes, comme par exemple 
greffage chimique ou electrochimique ^oligonucleotides sur support de verre ou de 
nylon. 

10 La presente invention a egalement pour objet un vecteur de clonage 

et/ou d'expression recombinant, notamment un plasmide, un virus, un vecteur viral ou 
un phage comprenant un fragment d'acide nucleique tel que defini ci-dessus. De 
preference, ledit vecteur recombinant est un vecteur d'expression dans lequel ledit 
fragment decide nucleique est place sous le controle d'eiements regulateurs de la 
15 transcription et de la traduction appropries. En outre, ledit vecteur peut comprendre 
des sequences (etiquettes ou tag) fusionnees en phase avec l'extremite 5* et/ou 3' dudit 
insert, utiles pour rimmobilisation, et/ou la detection et/ou la purification de la 
proteine exprimee k partir dudit vecteur. 

Ces vecteurs sont construits et introduits dans des cellules hdtes par 
20 les methodes classiques d'ADN recombinant et de genie genetique, qui sont connues 
en elles-memes. De nombreux vecteurs dans lesquels on peut ins6rer une molecule 
d'acide nucleique d'interet afin de Pintroduire et de la maintenir dans une cellule hote, 
sont connus en eux-memes ; le choix d'un vecteur approprie depend de Putilisation 
envisagee pour ce vecteur (par exemple replication de la sequence d'interet, expres- 
25 sion de cette sequence, maintien de la sequence sous forme extrachromosomique ou 
bien integration dans le materiel chromosomique de Phdte), ainsi que de la nature de la 
cellule hote. 

Conformement a Pinvention, ledit plasmide est notamment seiec- 
tionne parmi les plasmides suivants : 
30 - plasmide, denomme SARS-S, compris dans la souche bacte- 

rienne deposee sous le n° 1-3059, le 20 juin 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
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contient la sequence d'ADNc codant pour la proline S de la souche de SARS-CoV 
issue du prel&vement repertorie sous le n° 031589, laquelle sequence correspondant 
aux nucleotides des positions 21406 k 25348 (SEQ ID NO : 4), en reference a la 
sequence Genbank AY2741 19.3, 
5 - le plasmide, denomme SARS-S1, compris dans la souche bacte- 

rienne deposee sous le n° 1-3020, le 12 mai 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient un fragment 5' de la sequence d'ADNc codant pour la proteine S de la souche 
de SARS-CoV issue du pretevement repertorie sous le n° 031589, telle que definie ci- 

10 dessus, lequel fragment correspondant aux nucleotides des positions 21406 k 23454 
(SEQ ID NO :5), en reference a la sequence Genbank AY2741 19.3 Tor2, 

- le plasmide, denomme SARS-S2, compris dans la souche bacte- 
rienne deposee sous le n° 1-3019, le 12 mai 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 

15 contient un fragment 3'de la sequence d'ADNc codant pour la proline S de la souche 
de SARS-CoV issue du pr£16vement repertorie sous le n° 031589, telle que definie ci- 
dessus, lequel fragment correspondant aux nucleotides des positions 23322 k 25348 
(SEQ ID NO :6), en reference k la sequence Genbank n° d'acces AY2741 19.3, 

- le plasmide, denomme SARS-SE, compris dans la souche bacte- 
20 rienne deposee sous le n° 1-3126, le, 13 novembre 2003, aupres de la Collection 

Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15; il contient PADNc correspondant a la region situ£e entre PORF-S et 
PORF-E et chevauchant PORF-E de la souche de SARS-CoV issue du preievement 
r6pertorie sous le n° 031589, telle que definie ci-dessus, laquelle region correspondant 
25 aux nucleotides des positions 25110 k 26244 (SEQ ID NO :8), en reference a la 
sequence Genbank n° d'accds AY2741 19.3, 

- le plasmide, denomme SARS-E, compris dans la souche bacte- 
rienne deposee sous le n° 1-3046, le 28 mai 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, ( 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 

30 contient la sequence d'ADNc codant pour la proteine E de la souche de SARS-CoV 
issue du preievement repertorie sous le n° 031589, telle que definie ci-dessus, laquelle 
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sequence correspondant aux nucleotides des positions 26082 a 26413 (SEQ ID 
NO :15), en reference a la sequence Genbank n° d'acces AY2741 19.3, 

- le plasmide, denomme SARS-M ; compris dans la souche bacte- 
rienne depos^e sous le n° 1-3047, le 28 mai 2003, aupres de la Collection Nationale de 

5 Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient la sequence d' ADNc codant pour la proteine M de la souche de SARS-CoV 
issue du prelevement repertorie sous le n° 031589, telle que definie ci-dessus ; 
laquelle sequence correspondant aux nucleotides des positions 26330 a 27098 (SEQ 
ID NO :18), en reference a la sequence Genbank n° d'acces AY2741 19.3, 

10 - le plasmide denomme SARS-MN, compris dans la souche bacte- 

rienne deposee sous le n° 1-3125, le 13 novembre 2003, aupres de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15 ; il contient la sequence d'ADNc correspondant a la region situee entre 
l'ORF-M et l'ORF-N de la souche de SARS-CoV issue du prelevement repertorie 

15 sous le n° 031589 et prelevee a Hanoi, telle que definie ci-dessus, laquelle sequence 
correspondant aux nucleotides des positions 26977 a 28218 (SEQ ID NO :20), en refe- 
rence a la sequence Genbank n° d'acces AY2741 19.3, 

- le plasmide denomme SARS-N, compris dans la souche bacte- 
rienne deposee sous le n° 1-3048, le 5 juin 2003, aupres de la Collection Nationale de 

20 Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient l'ADNc codant pour la proteine N de la souche de SARS-CoV issue du 
prelevement repertorie sous le n° 031589, telle que definie ci-dessus, laquelle 
sequence correspondant aux nucleotides des positions 28054 a 29430 (SEQ ID 
NO:38), en reference a la sequence Genbank n° d'acces AY274 11 9.3 ; ainsi ce 

25 plasmide comprend un insert de sequence SEQ ID NO :38 et est compris dans une 
souche bacterienne qui et qu'il a ete deposee sous le n° 1-3048, le 5 juin 2003, aupres 
de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 
75724 Paris Cedex 15, 

- le plasmide denomme SARS-5'NC, compris dans la souche bacte- 
30 rienne deposee sous le n° I- 3124, le 7 novembre 2003, aupres de la Collection 

Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15 ; il contient l'ADNc correspondant a Pextremite 5'non codante du genome 
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de la souche de SARS-CoV issue du pr&evement r£pertori<§ sous le n° 031589, telle 
que definie ci-dessus, laquelle sequence correspondant aux nucleotides des positions 1 
a 204 (SEQ ID NO :39), en reference a la sequence Genbank n° d'accds AY2741 19.3, 

- le plasmide denomm6 SARS-3'NC, compris dans la souche bacte- 
5 rienne d6pos<§e sous le n° 1-3123 le 7 novembre 2003, aupres de la Collection 

Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15. ; il contient la sequence d'ADNc correspondant a l'extremit6 3'non codante 
du genome de la souche de SARS-CoV issue du pretevement repertorie sous le n° 
031589, telle que definie ci-dessus, laquelle sequence correspondant a celle situee 
10 entre le nucleotide en position 28933 a 29727 (SEQ ID NO :40), en reference a la 
sequence Genbank n° d'accfcs AY2741 19.3, se termine par une s&ie de nucleotides a., 

- le plasmide d'expression d&iomm6 pIV2.3N, contenant un 
fragment d'ADNc codant pour une fusion C-terminale de la proteine N (SEQ ID NO : 
37) avec une etiquette polyhistidine, 

15 - le plasmide d' expression d^nomme pIV2.3Sc, contenant un 

fragment d'ADNc codant pour une fusion C-terminale du fragment correspondant aux 
positions 475 k 1 193 de la sequence en acides amines de la proteine S (SEQ ID NO : 
3) avec une Etiquette polyhistidine, 

- le plasmide d'expression pIV2.3Su contenant un fragment 
20 d'ADNc codant pour une fusion C-terminale du fragment correspondant aux positions 

14 a 1 193 de la sequence en acides amines de la proline S (SEQ ID NO : 3) avec une 
etiquette polyhistidine, 

- le plasmide d'expression d&iomme pIV2.4N, contenant un 
fragment d'ADNc codant pour une fusion N-terminale de la proteine N (SEQ ID NO : 

25 3) avec une etiquette polyhistidine, 

- le plasmide d'expression d&iomm6 pIV2.4S c ou pIV2.4Si, conte- 
nant un insert codant pour une fusion N-terminale du fragment correspondant aux 
positions 475 a 1193 de la sequence en acides amines de la proline S (SEQ ID NO : 
3) avec une etiquette polyhistidine, et 

30 - le plasmide d'expression denommS pIV2.4S L contenant un 

fragment d'ADNc codant pour une fusion N-terminale du fragment correspondant aux 
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positions 14 a 1 193 de la sequence en acides amines de la proteine S (SEQ ID NO : 3) 
avec une etiquette polyhistidine. 

Selon une disposition avantageuse du plasmide d'expression tel que 
defini ci-dessus, il est compris dans une souche bacterienne qui a 6t6 deposee sous le 
5 n° I- 3117, le 23 octobre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 

Selon une autre disposition avantageuse du plasmide d'expression 
tel que defini ci-dessus, il est compris dans une souche bacterienne qui a ete deposee 
sous le n° I- 3118, le 23 octobre 2003, aupres de la Collection Nationale de Cultures 
1 0 de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 1 5 . 

Selon une autre disposition du plasmide d'expression tel que defini 
ci-dessus, il est compris dans une souche bacterienne qui a 6t6 deposee a la CNCM, 25 
rue du Docteur Roux, 75724 Paris Cedex 15 sous les numeros suivants : 
a) souche n° I- 3 1 1 8, deposee le 23 octobre 2003, 
1 5 b) souche n° I- 3 0 1 9, deposee le 1 2 mai 2003 , 

c) souche n° I- 3020, deposee le 12 mai 2003, 

d) souche n°I-3059, deposee le 20 juin 2003, 

e) souche n° 1-3323, deposee le 22 novembre 2004, 

f) souche n° 1-3 324, deposee le 22 novembre 2004, 
20 g) souche n° 1-3326, deposee le 1 er d6cembre 2004, 

h) souche n° 1-3327, deposee le l er decembre 2004, 

i) souche n° 1-3332, deposee le l er decembre 2004, 
j) souche n° 1-3333, deposee le l er decembre 2004, 
k) souche n°I-3334, deposee le l er decembre 2004, 

25 1) souche n° 1-3335, deposee le l er decembre 2004, 

m) souche n° 1-3336, deposee le l er decembre 2004, 

n) souche n° 1-3337, deposee le l er decembre 2004, 

o) souche n° 1-3338, deposee le 2 decembre 2004, 

p) souche n° 1-3339, deposee le 2 decembre 2004, 
30 q) souche n° 1-3340, deposee le 2 decembre 2004, 

r) souche n° 1-3341 , deposee le 2 decembre 2004. 
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La presente invention a egalement pour objet un inserat d' acide 
nucieique d'origine virale, caracteris6 en ce qu'il est contenu dans Tune quelconque 
des souches telles que definies ci-dessus en a)-r). 

La presente invention a egalement pour objet un acide nucieique 
5 comportant un g£ne synthetique permettant une expression optimis^e de la proteine S 
dans des cellules eucaryotes, caract6rise en ce qu'il possdde la sequence SEQ ID NO: 
140. 

La presente invention a egalement pour objet un vecteur 
d 5 expression comportant un acide nucieique comportant un gene synthetique permet- 
10 tant une expression optimisSe de la proline S, lequel vecteur est contenu dans la 
souche bacterienne deposde k la CNCM, le l er decembre 2004, sous le n°I-3333. 

Selon un mode de realisation dudit vecteur d'expression, il s f agit d'un 
vecteur viral, sous forme de particule virale ou sous forme de genome recombinant. 

Selon une disposition avantageuse de ce mode de realisation, il s'agit 
15 d'une particule virale recombinante ou d'un genome viral recombinant susceptible 
d'etre obtenu par transfection d'un plasmide selon les alineas g), h) et k) a r) tels que 
definis ci-dessus, dans un systdme cellulaire approprie, c'est-a-dire, par exemple, des 
cellules transferees avec un ou plusieurs autres plasmide(s), destines a trancomple- 
menter certaines fonctions du virus del6t6es dans le vecteur et necessaires a la forma- 
20 tion des particules virales. 

On entend ici par « famille de la proteine S » la proline S complete, 
son ectodomaine et des fragments de cet ectodomaine qui sont de preference produits 
dans un systeme eucaryote. 

La presente invention a egalement pour objet un vecteur lentiviral 
25 codant pour un polypeptide de la famille de la proteine S, telle que definie ci-dessus. 

La presente invention a egalement pour objet un virus rougeole 
recombinant codant pour un polypeptide de la famille de la proteine S, telle que 
definie ci-dessus. 

La presente invention a egalement pour objet un virus vaccine 
30 recombinant codant pour un polypeptide de la famille de la proteine S, telle que 
definie ci-dessus. 
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La presente invention a egalement pour objet l'utilisation d'un 
vecteur selon les alineas e) h r) tels que d£finis ci-dessus, ou d'un vecteur comportant 
exprimant un gene synth&ique de la proline S, tel que d£fini ci-dessus, pour la 
production, en systeme eucaryote, de la proline S du coronavirus associe au SRAS, 
5 ou d'un fragment de cette proteine. 

La presente invention a Egalement pour objet une methode de 
production de la proteine S en systeme eucaryote, comportant une 6tape de transfec- 
tion de cellules eucaryotes en culture par un vecteur choisi parmi les vecteurs contenus 
dans les souches bacteriennes mentionn£es aux alineas e) a r) ci-dessus ou un vecteur 
10 comportant un gene synthStique permettant une expression optimisee de la proteine S. 

La presente invention a egalement pour objet une banque d'ADNc 
caracteris6e en ce qu'elle comprend des fragments tels que d&Snis ci-dessus, en parti- 
culier des fragments d'amplification ou des fragments de restriction, clones dans un 
vecteur recombinant, notamment un vecteur d'expression (banque d'expression). 
15 La presente invention a egalement pour objet des cellules, notam- 

ment des cellules procaryotes, modifiees par un vecteur recombinant tel que defini ci- 
dessus. 

La presente invention a egalement pour objet une cellule eucaryote 
g£netiquement modifiee exprimant une proteine ou un polypeptide tels que definis ci- 

20 apres. Bien 6videmment, les termes "cellule eucaryote gen£tiquement modifiee' 1 ne 
dSsignent pas ime cellule modifiee par un virus sauvage. 

Selon un mode de realisation avantageux de ladite cellule, elle est 
susceptible d'Stre obtenue par transfection par Tun quelconque des vecteurs mention- 
's aux alineas i) k 1) ci-dessus. 

25 Selon une disposition avantageuse de ce mode de realisation, il s ! agit 

de la cellule FRhK4-Ssol-30, depos^e a la CNCM le 22 novembre 2004, sous le n°I- 
3325. 

Les vecteurs recombinants tels que definis ci-dessus et les cellules 
30 transferases par lesdits vecteurs d'expression sont avantageusement utilises pour la 
production des prolines et des peptides correspondants. Les banques d'expression 
derivees desdits vecteurs, ainsi que les cellules transform^es par lesdites banques 
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d' expression sont avantageusement utilises pour identifier les Epitopes immunogdnes 
(epitopes B et T) des prolines du coronavirus associe au SRAS. 

La presente invention a egalement pour objet les proteines et les 
peptides purifiees ou isolees, caracteris^s en ce qu'ils sont codes par le polynucleotide 
5 ou Tun de ses fragments tels que definis ci-dessus. 

Selon un mode de realisation avantageux de Pinvention, ladite 
proteine est s61ectionnee dans le groupe constitue par : 

- la proteine S de sequence SEQ ID NO :3 ou son ectodomaine 

- la proteine E de sequence SEQ ID NO : 14 
10 - la prot&ne M de sequence SEQ ID NO : 1 7 

- la proteine N de sequence SEQ ID NO : 37 

- les proteines codees par les ORFs : ORE la, ORFlb, ORF3 5 ORF4 
et ORF7 a ORF11, ORF13 et ORF14 de sequence respectivement, SEQ ID NO :74, 
75, 10, 12, 22, 24, 26, 28, 30, 33 et 35. 

15 On utilisera ci-apres indifferemment les termes « ectodomaine de la 

proline S » et « forme soluble de la proteine S ». 

Selon un mode de realisation avantageux de P invention, ledit poly- 
peptide est constitue des acides amines correspondant aux positions 1 k 1193 de la 
sequence en acides amines de la proteine S 

20 Selon un autre mode de realisation avantageux de Pinvention, ledit 

peptide est s£lectionn£ dans le groupe constitue par : 

a) les peptides correspondant aux positions 14 a 1193 et 475 a 1193 
de la sequence en acides amines de la proteine S, 

b) les peptides correspondant aux positions 2 k 14 (SEQ ID NO : 69) 
25 et 100 a 221 de la sequence en acides amines de la proteine M ; ces peptides corres- 
pondent respectivement a Pectodomaine et k Pendodomaine de la proteine M, et 

c) les peptides correspondant aux positions 1 a 12 (SEQ ID NO : 70) 
et 53 a 76 (SEQ ID NO : 71) de la sequence en acides amines de la proteine E ; ces 
peptides correspondent respectivement k Pectodomaine et a Pextremite C-terminale de 

30 la proteine E, et 
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d) les peptides de 5 a 50 acides amines consecutifs, de pref6rence de 
10 a 30 acides amines, inclus ou chevauchant partiellement ou totalement la sequence 
des peptides tels que definis en a), b) ou c). 

La presente invention a egalement pour objet un peptide caract6rise 
5 en ce qu'il presente une sequence de 7 a 50 acides amines incluant un residu d'acide 
amine seiectionne dans le groupe constitue par : 

- l'alanine situee en position 2552 de la sequence en acides amines 

de la proteine codee par l'ORFla. 

- la serine situee en position 577 de la sequence en acides amines de 
1 0 la proteine S de la souche de S ARS-Co V telle que definie ci-dessus, 

- la glycine en position 11 de la sequence en acides amines de la 
proteine codee par l'ORF3 de la souche de SARS-CoV telle que deiinie ci-dessus, 

- la serine en position 154 de la sequence en acides amines de la 
proteine M de la souche de SARS-CoV telle que deiinie ci-dessus. 

15 La presente invention a egalement pour objet un anticorps ou un 

fragment d'anticorps polyclonal ou monoclonal, susceptible d'8tre obtenu par immu- 
nisation d'un animal avec un vecteur recombinant tel que defrni ci-dessus, une banque 
d'ADNc telle que deiinie ci-dessus ou bien une proteine ou un peptide tels que deiinis 
ci-dessus, caracterise en ce qu'il se lie avec Tune au moins des prot6ines codees par le 

20 SARS-CoV telles que deiinies ci-dessus. 

L'invention englobe les anticorps polyclonaux, les anticorps mono- 
clonaux, les anticorps cbimeriques tels que les anticorps humanises, ainsi que leurs 
fragments (Fab, Fv, scFv). 

La pr6sente invention a egalement pour objet un hybridome produi- 

25 sant un anticorps monoclonal contre la proteine N, caracterise en ce qu'il est choisi 
parmi les hybridomes suivants : 

- l'hybridome produisant l'anticorps monoclonal 87, depos<§ a la 
CNCM le l er decembre 2004 sous le numero 1-3328, 

- l'hybridome produisant l'anticorps monoclonal 86, depose k la 
30 CNCM le l er decembre 2004 sous le numero 1-3329, 

- l'hybridome produisant l'anticorps monoclonal 57, deposit a la 
CNCM le l er decembre 2004 sous le numero 1-3330, et 
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- rhybridome produisant l'anticorps monoclonal 156, depose k la 
CNCM le l er decembre 2004 sous le num6ro 1-3331. 

La presente invention a egalement pour objet un anticorps ou 
fragment d' anticorps polyclonal ou monoclonal dirigS contre la proteine N, caracterisS 
5 en ce qu'il est produit par un hybridome tel que defini ci-dessus. 

Au sens de la presente invention, on entend par anticorps 
chimerique, relativement a un anticorps d'une espece animale particuliere ou d'une 
classe particuliere d'anticorps, un anticorps comprenant tout ou partie d'une chaine 
lourde et/ou d'une chaine leg&re d ! un anticorps d'une autre espece animale ou d'une 
1 0 autre classe d'anticorps. 

Au sens de la presente invention, on entend par anticorps humanist 
une immmunoglobuline humaine dans laquelle les r^sidus des CDRs 
{Complementary-Determining Regions) qui forment le site de liaison a Tantigdne sont 
remplac<§s par ceux d ! un anticorps monoclonal non-humain poss^dant la sp^cificite, 
15 1'affinite ou l'activite recherchees. Par comparaison avec les anticorps non-humains, 
les anticorps humanises sont moins immunogdnes et possedent une demi-vie prolon- 
gs chez l'Homme car ils ne possedent qu'une faible proportion de sequences non- 
humaines 6tant donne que la quasi-totalite des residus des regions FR (Framework) et 
de la region constante (Fc) de ces anticorps sont ceux d'une sequence consensus 
20 d'immunoglobulines humaines. 

La presente invention a Egalement pour objet une puce ou filtre a 
proline, caracterisS en ce qu'il comprend une proteine, un peptide ou bien un anti- 
corps tels que definis ci-dessus, 

Les puces k proteine selon Finvention sont prepares par les 
25 methodes classiques, connues en elles-memes. Parmi les supports approprtes sur 
lesquels peuvent dtre immobilises des proteines, on peut citer ceux en matiere 
plastique ou en verre, notamment sous la forme de microplaques. 

La presente invention a egalement pour objet des rdactifs d&iv6s de 
la souche isolee de coronavirus associe au SRAS, issue du prStevement repertory sous 
30 le n° 031589, utiles pour PStude et le diagnostic de 1'infection provoquee par un coro- 
navirus assocte au SRAS, lesquels r^actifs sont s&ectionnes dans le groupe constituS 
par : 
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(a) une paire d'amorces, une sonde ou une puce a ADN telles que 



d£finies ci-dessus, 



(b) un vecteur recombinant ou une cellule modifiee tels que definis 



ci-dessus, 



5 



(c) une souche isol£e de coronavirus ou un polynucleotide tels que 



definis ci-dessus, 



10 



(d) une proteine ou un peptide tel que defini ci-dessus, 

(e) un anticorps ou fragment d' anticorps tels que definis ci-dessus, et 

(f) une puce k proline telle que d^finie ci-dessus, 

Ces diffgrents r^actifs sont pr6par6s et utilises selon les techniques 



classiques de biologie moteculaire et d' immunologic, en suivant les protocoles 
standards tels que ceux dScrits dans Current Protocols in Molecular Biology 
(Frederick M. AUSUBEL, 2000, Wiley and Son Inc., Library of Congress, USA), 
dans Current Protocols in Immunology (John E. Cologan, 2000, Wiley and Son Inc. 
15 Library of Congress, USA) et dans Antibodies : A Laboratory Manual (E. Howell and 
D Lane, Cold Spring Harbor Laboratory, 1988) 



utilises selon les techniques classiques telles que d^finies ci-dessus. Les peptides et les 
proteines selon Tinvention sont pr£par6s par les techniques d'ADN recombinant, 
20 connues de THomme du metier, notamment a Paide des vecteurs recombinants tels 
que definis ci-dessus. Alternativement, les peptides selon Tinvention peuvent etre 
prepares par les techniques classiques de synthese en phase solide ou liquide, connues 
de l'Homme du metier. 



25 animal approprie avec une proteine ou un peptide tels que definis ci-dessus, eventuel- 
lement coupte k la KLH ou k l'albumine et/ou assocte k un adjuvant approprte tel que 
l'adjuvant de Freund (complet ou incomplet) ou I'hydroxyde d'alumine ; apres obten- 
tion d'un titre en anticorps satisfaisant, les anticorps sont recolt£s par pr£ldvement du 
s£rum des animaux immunises et enrichis en IgG par precipitation, selon les 

30 techniques classiques, puis les IgG sp£cifiques des prolines du SARS-CoV sont 
6ventuellement purifiees par chromatographic d'affinit£ sur une colonne appropriee 



Les fragments d'acide nucl&que selon V invention sont prepares et 



Les anticorps polyclonaux sont prepares par immunisation d 1 



un 
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sur laquelle sont fix6s ledit peptide ou ladite proline, tels que definis ci-dessus, de 
fa9on a obtenir une preparation d'IgG monospScifiques. 

Les anticorps monoclonaux sont produits a partir d r hybridomes 
obtenus par fusion de lymphocytes B d ! un animal immunise par une prot&ne ou un 
5 peptide tels que definis ci-dessus avec des myelomes, selon la technique de KQhler et 
Milstein (Nature, 1975, 256, 495-497) ; les hybridomes sont cultives in vitro, notam- 
ment dans des fermenteurs ou produits in vivo, sous forme d'ascite ; alternativement 
lesdits anticoips monoclonaux sont produits par g&iie g6netique comme decrit dans le 
brevet am6ricain US 4,816,567. 

10 Les anticorps humanisms sont produits par des methodes generates 

comme celles decrites dans la Demande Internationale WO 98/45332. 

Les fragments d'anticorps sont produits k partir des regions V H et 
Vl clonees, & partir des ARNm d'hybridomes ou de lymphocytes spteniques d'une 
souris immunisee ; par exemple, les fragments Fv, scFv ou Fab sont exprimes & la 

15 surface de phages filamenteux selon la technique de Winter et Milstein (Nature, 1991, 
349, 293-299) ; apres plusieurs etapes de selection, les fragments d'anticorps 
sp£cifiques de Tantig&ie sont isoles et exprimes dans un systeme d'expression appro- 
prie, par les techniques classiques de clonage et d'expression d'ADN recombinant. 

Les anticorps ou leur fragments tels que definis ci-dessus, sont 

20 purifies par les techniques classiques connues de THomme du metier, telles que la 
chromatographic d'affinite. 

La pr£sente invention a en outre pour objet Putilisation d'un produit 
selectionne dans le groupe constitue par : une paire d' amorces, une sonde, une puce a 
ADN, un vecteur recombinant, une cellule modifiee, une souche isotee de coronavirus, 

25 un polynucleotide, une proteine ou un peptide, un anticorps ou un fragment 
d'anticorps et une puce a proline tels que ddfinis ci-dessus, pour la preparation d'un 
reactif de detection et 6ventuellement de g6notypage/s6rotypage, d'un coronavirus 
assocte au SRAS. 

Les prolines et les peptides selon T invention, qui sont aptes a Stre 
30 reconnus et/ou a induire la production d'anticorps sp6cifiques du coronavirus associ6 
au SRAS, sont utiles pour le diagnostic de Tinfection par un tel coronavirus ; 
l'infection est detectee, par une technique appropriee- notamment EIA, ELISA, RIA, 
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immunofluorescence-, k partir <Tun Echantillon biologique pr61eve chez un individu 
susceptible d'etre infects. 

Selon une disposition avantageuse de ladite utilisation, lesdites 
prolines sont selectionn£es dans le groupe constitue par les proteines S, E, M et/ou N 
5 et les peptides tels que d&finis ci-dessus. 

Les prolines S, E, M et/ou N et les peptides derives de ces prot&nes 
tels que d&finis ci-dessus, par exemple la proteine N, sont utilisees pour le diagnostic 
indirect d'une infection k coronavirus associ£ au SRAS (diagnostic s6rologique ; 
detection d'anticorps sp£cifiques du SARS-CoV), notamment par une methode 
10 immunoenzymatique (ELISA). 

.Les anticorps et les fragments d'anticoips selon Pinvention, 
notamment ceux diriges contre les prolines S, E, M et/ou N et les peptides derives 
tels que d6finis ci-dessus, sont utiles pour le diagnostic direct d'une infection a coro- 
navirus associe au SRAS ; la detection de proteine(s) du SARS-CoV est r£alisee par 
1 5 une technique approprtee, notamment EIA, ELISA, RIA, immunofluorescence a partir 
d'un Echantillon biologique preleve chez un individu susceptible d'etre infects. 

La pr6sente invention a 6galement pour objet une methode de detec- 
tion d'un coronavirus associE au SRAS, k partir d'un echantillon biologique, laquelle 
methode est caracteris£e en ce qu'elle comprend au moins : 
20 (a) la mise en contact dudit echantillon biologique avec au moins un 

anticorps ou un fragment d'anticorps, une prot&ne, un peptide ou bien une puce ou un 
filtre k proline ou k peptide tels que d£finis ci-dessus, et 

(b) la revelation par tout moyen approprte des complexes antig&ie- 
anticorps formes en (a), par exemple par EIA, ELISA, RIA, ou par immunofluores- 
25 cence. 

Selon un mode de mise en oeuvre avantageux dudit proc£d6 l'Etape 

(a) comprend : 

(ai) la mise en contact dudit echantillon biologique avec au moins un 
premier anticorps ou un fragment d'anticorps qui est fix6 sur un support appropri6, 
3 0 notamment une microplaque, 

(a2) le lavage de la phase solide, et 
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(a3) Paddition d'au moins un second anticorps ou un fragment 
d'anticorps, different du premier, ledit anticorps ou fragment d'anticorps etant 
eventuellement marque de fa?on appropriee. 

Ce procede qui permet de capturer les particules virales presentes 
5 dans Pechantillon biologique est egalement d6nomm6 procede d'immunocapture. 

Par exemple : 

- Tetape (ai) est r6alis6e avec au moins un premier anticorps mono- 
clonal ou polyclonal ou un fragment de ceux-ci, dirige contre la proteine S, M, et/ou 
E, et/ou un peptide correspondant k Pectodomaine de Tune de ces proteines (peptides 

10 M2-14ouEl-12) 

- Tetape (a3) est realis^e avec au moins un anticorps ou un fragment 
d'anticorps dirige contre un autre epitope de la meme proline ou de preference contre 
une autre proteine, de maniere preferte contre une proline interne telle que la nucleo- 
proteine N ou Pendodomaine de la proline E ou M 5 de mantere encore plus pr6feree 

15 il s'agit d'anticorps ou de fragments d'anticorps diriges contre la proteine N qui est 
tr&s abondante dans la particule virale ; lorsqu'un anticorps ou un fragment 
d'anticorps dirige contre une proteine interne (N) ou contre Pendodomaine des 
prolines E ou M est utilise, le dit anticorps est incube en presence de detergent, 
comme le Tween 20 par exemple, a des concentrations de Pordre de 0,1 %. 

20 - Petape (b) de revelation des complexes antigene-anticorps formes 

est realis^e, soit directement a Paide d'un second anticorps marque par exemple avec 
de la biotine ou une enzyme appropriee telle que la peroxydase ou la phosphatase 
alcaline, soit indirectement a Paide d'un serum anti-immunoglobulines marque 
comme ci-dessus. Les complexes ainsi formes sont r6vel6s & Paide d'un substrat 

25 approprie. 

Selon une mise en oeuvre prefe^e de cet aspect de Tinvention, 
l'ediantillon biologique est melange k l'anticorps monoclonal de relation pr^alable- 
ment k sa mise en contact avec les anticorps monoclonaux de capture. Le cas echeant, 
le melange serum-anticorps de revelation est incube pendant au moins 10 minutes a 
30 temperature ambiante avant d'etre applique sur la plaque. 

La presente invention a egalement pour objet un test d'immuno- 
capture destine h detecter une infection par le coronavirus associe au SRAS par 
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detection de la nucleoprot&ne native (proteine N), en particulier caract6rise en ce que 
Panticorps utilise pour la capture de la nucieoproteine virale native est un anticorps 
monoclonal spScifique de la region centrale et/ou d'un epitope conformationnel. 

Selon un mode de realisation dudit test, Tanticorps utilise pour la 
5 capture de la proteine N est Tanticorps monoclonal Acm87, produit par 1'hybridome 
depose k la CNCM le l er decembre 2004 sous le numero 1-3328. 

Selon un autre mode de realisation dudit test d'immunocapture, 
l'anticorps utilise pour la capture de la proline N est l'anticorps monoclonal Acm86, 
produit par l'hybridome depose k la CNCM le l er decembre 2004 sous le numero I- 
10 3329. 

Selon un autre mode de realisation dudit test d'immunocapture, les 
anticorps monoclonaux Acm86 et Acm87 sont utilises pour la capture de la proteine 
N. 

Dans les tests d'immunocapture selon Finvention, on peut utiliser 
15 pour la revelation de la proline N, l'anticorps monoclonal Acm57, produit par 
Thybridome depose k la CNCM le l er decembre 2004 sous le numero 1-3330, ledit 
anticorps etant conjugu£ a une molecule ou une particule revelatrice. 

Conformement audit test d'immunocapture, une combinaison des 
anticorps Acm57 et Acm87, conjugues a une molecule ou une particule revelatrice, est 
20 utilisee pour la revelation de la proteine N. 

Une molecule revelatrice peut etre un atome radioactif, un colorant, 
une molecule fluorescente, un fluorophore, une enzyme ; une particule revelatrice peut 
etre, par exemple : de Tor colloidal, une particule magnetique ou une bille de latex. 

La presente invention a egalement pur objet un reactif de detection 
25 d'un coronavirus associe au SRAS, caracterise en ce qu'il est seiectionne dans le 
groupe constitue par : 

(a) une paire d' amorces ou une sonde telles que definies ci-dessus, 
(b) un vecteur recombinant tel que defini ci-dessus ou une cellule 
modifiee telle que definie ci-dessus, 
30 (c) une souche isoiee de coronavirus telle que definie ci-dessus ou un 

polynucleotide tel que defini ci-dessus, 

(d) un anticorps ou un fragment d' anticorps tel que defini ci-dessus, 
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(e) une combinaison d'anticorps comprenant les anticorps monoclo- 
naux Acm86 et/ou Acm87, et l'anticorps monoclonal Acm57, telle que definie ci- 
dessus, 

(f) une puce ou un filtre tels que definis ci-dessus. 

5 La presente invention a egalement pour objet une methode de detec- 

tion d'une infection par un coronavirus associe au SRAS, & partir d'un echantillon 
biologique, par ELISA IgG indirect utilisant la proteine N, laquelle methode est 
caracterisee en ce que les plaques sont sensibilisees par une solution de proteine N a 
une concentration comprise entre 0,5 et 4|i.g/mL, de preference 2|4,g/mL, dans un 
1 0 tampon PBS 1 OmM pH 7,2, rouge de phenol a 0,25mL /L. 

La presente invention a, en outre, pour objet une methode de detec- 
tion d'une infection par un coronavirus associe au SRAS, k partir d'un echantillon 
biologique, par ELISA double Epitope, caracterisee en ce que le serum a tester est 
m61ang£ & Tantigene de revelation, ledit melange etant ensuite mis au contact de l'anti- 
1 5 gdne fixe sur un support solide. 

Selon une variante des tests de detection des coronavirus associe au 
SRAS, ces tests combinent un ELS A utilisant la proteine N, et un autre ELSA utilisant 
la proteine S, tel que decrit plus bas. 

La presente invention a aussi pour objet un complexe immun forme 
20 d'un anticorps ou d ? un fragment d'anticorps polyclonal ou monoclonal tel que defini 
ci-dessus, et d'une proteine ou d'un peptide du coronavirus associe au SRAS. 

La presente invention a en outre pour objet un kit de detection d'un 
coronavirus associe au SRAS, caracterise en ce qu'il comprend au moins un reactif 
seiectionne dans le groupe constitue par : une pake d'amorces, une sonde, une puce a 
25 ADN ou & ARN, un vecteur recombinant, une cellule modifiee, une souche isoiee de 
coronavirus, un polynucleotide, une proteine ou un peptide, un anticorps, et une puce k 
proteine tels que definis ci-dessus. 

La presente invention a en outre pour objet, une composition 
immunogene, caracterisee en ce qu'elle comprend au moins un produit seiectionne 
30 dans le groupe constitue par : 

a) une proteine ou un peptide tels que definis ci-dessus, 
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b) un polynucleotide de type ADN ou ARN ou Tun de ses fragments 
representatifs tels que d&finis ci-dessus, de sequence choisie parmi : 

(i) la sequence SEQ ID NO : 1 ou son equivalent ARN 

(ii) la sequence hybridant dans des conditions de forte stringence 
5 avec la sequence SEQ ID NO : 1, 

(iii) la sequence complernentaire de la sequence SEQ ID NO : 1 ou 
de la sequence hybridant dans des conditions de forte stringence avec la sequence 
SEQ ID NO: 1, 

(iv) la sequence nucieotidique d'un fragment representatif du poly- 
10 nucleotide tel que defini en (i), (ii) ou (iii), 

(v) la sequence telle que definie en (i), (ii), (iii) ou (iv), modifiee, et 

c) un vecteur d'expression recombinant comprenant un polynucleo- 
tide tel que defini en b), et 

d) une banque d'ADNc telle que definie ci-dessus, 

15 ladite composition immunogene 6tant capable d'induire une immunite humorale ou 
cellulaire protectrice sp^cifique du coronavirus associe au SRAS, notamment la 
production d'un anticorps dirige contre un epitope specifique du coronavirus associe 
au SRAS. 

Les proteines et les peptides tels que definis ci-dessus, notamment 
20 les proteines S, M, E et/ou N et les peptides derives, ainsi que les molecules d'acide 
nucieique (ADN ou ARN) codant lesdites proteines ou lesdits peptides, sont de bons 
candidats vaccin et peuvent etre utilisees dans des compositions immunogenes pour la 
production d'un vaccin contre le coronavirus associe au SRAS. 

Selon un mode de realisation avantageux des compositions selon 
25 l'invention, elles contiennent en outre, au moins un vehicule pharmaceutiquement 
acceptable et eventuellement des substances porteuses et/ou des adjuvants. 

Les vehicules pharmaceutiquement acceptables, les substances 
porteuses et les adjuvants sont ceux classiquement utilises. 

Les adjuvants sont avantageusement choisis dans le groupe constitue 
30 par des emulsions huileuses, de la saponine, des substances minerales, des extraits 
bacteriens, de l'hydroxyde d'alumine et le squalene. 
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Les substances porteuses sont avantageusement selectionnees dans 
le groupe constitue par des liposomes unilamellaires, des liposomes multilamellaires, 
des micelles de saponine ou des microspheres solides de nature saccharidique ou 
aurifere. 

5 Les compositions selon P invention, sont administrees par voie 

gen6rale, notamment intramusculaire ou sous-cutanee ou bien par voie locale notam- 
ment nasale (aerosol). 

La presente invention a egalement pour objet Putilisation d'une 
proline ou d'un peptide isole ou purifie presentant une sequence selectionnee dans le 
10 groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 
33, 35, 37, 69, 70, 71, 74 et 75 pour former un complexe immun avec un anticorps 
dirige sp6cifiquement contre un epitope du coronavirus associe au SRAS. 

La presente invention a egalement pour objet un complexe immun 
forme d'une proline ou d'un peptide isole ou purifie presentant une sequence selec- 
15 tionn^e dans le groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 
24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 et 75, et d'un anticorps dirige specifiquement 
contre un epitope du coronavirus associe au SRAS. 

La presente invention a egalement pour objet Putilisation d'une 
proline ou d'un peptide isole ou purifie presentant une sequence selectionnee dans le 
20 groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 
33, 35, 37, 69, 70, 71, 74 et 75 pour induire la production d'un anticorps capable de 
reconnaitre sp6cifiquement un epitope du coronavirus associ£ au SRAS. 

La pr£sente invention a egalement pour objet Putilisation d'un poly- 
nucleotide isole ou purifie presentant une sequence selectionnee dans le groupe 
25 constitue par les sequences SEQ ID NO : 1, 2, 4, 7, 8, 13, 15, 16, 18, 19, 20, 31, 36 et 
38 pour induire la production d'un anticorps dirige contre la proteine codee par ledit 
polynucleotide et capable de reconnaitre specifiquement un epitope du coronavirus 
associe au SRAS 

La presente invention a egalement pour objet des anticorps mono- 
30 clonaux reconnaissant la proteine S native d'un coronavirus associe au SRAS. 

La presente invention a egalement pour objet Putilisation d f une 
proteine ou d'un polypeptide de la famille de la proteine S, telle que definie ci-dessus, 
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ou d'un anticorps reconnaissant la proline S native, tel que defini ci-dessus, pour 
detecter une infection par un coronavirus associe au SRAS, a partir d'un echantillon 
biologique. 

La presente invention a egalement pour objet une methode de detec- 
5 tion d'une infection par un coronavirus associe au SRAS, a partir d'un echantillon 
biologique, caracterisee en ce que la detection est effectuee par ELISA utilisant la 
proteine S recombinante, exprim6e dans un systeme eucaryote. 

Selon un mode de mise en oeuvre avantageux de ladite methode, il 
s f agit d ! une methode par ELISA double epitope, et le serum a tester est melange k 
10 Tantigene de revelation, ledit melange etant ensuite mis au contact de l'antig&ne fixe 
sur un support solide. 

La presente invention a aussi pour objet un complexe immun forme 
d'un anticorps ou d ! un fragment d'anticorps monoclonal reconnaissant la proline S 
native, et d'une proline ou d'un peptide du coronavirus associe au SRAS. 
15 La presente invention a egalement pour objet un complexe immun 

forme d'une proteine ou d'un polypeptide de la famille de la proteine S, telle que 
definie ci-dessus, et d'un anticorps dirige specifiquement contre un epitope du coro- 
navirus associe au SRAS. 

La presente invention a en outre pour objet un kit ou coffret de 
20 detection d'un coronavirus associe au SRAS, caracterise en ce qu'il comprend au 
moins un reactif seiectionne dans le groupe constitue par : une proteine ou polypeptide 
de la famille de la proteine S, telle que definie ci-dessus, un acide nucieique codant 
pour une proteine ou polypeptide de la famille de la proteine S, telle que definie ci- 
dessus, une cellule exprimant une proteine ou polypeptide de la famille de la proteine 
25 S, telle que definie ci-dessus, ou un anticorps reconnaissant la proteine S native d'un 
coronavirus associe au SRAS. 

La presente invention a pour objet une composition immunogene 
et/ou vaccinale, caracterisee en ce qu'elle comprend un polypeptide ou une proteine 
recombinante de la famille de la proteine S, telle que definie ci-dessus, obtenu dans un 
3 0 systeme ^expression eucaryote. 

La presente invention a egalement pour objet une composition 
immunogene et/ou vaccinale, caracterisee en ce qu f elle comprend un vecteur ou virus 
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recombinant, exprimant une proteine ou un polypeptide de la famille de la proline S, 
telle que definie ci-dessus. 

Outre les dispositions qui precedent, l'invention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se r6f£re a 
5 des exemples de mise en oeuvre du polynucleotide repr^sentant le genome de la 
souche de SARS-CoV issue du pr£levement rSpertorie sous le numero 031589, et des 
fragments d'ADNc derives objets de la pr^sente invention, ainsi qu'au Tableau I 
presentant la liste des sequences : 



Tableau I : Liste des sequences 



numero 

■ ■ %M III W 1 \Jf 

d'identification 




Position Ha 
I'ADNc en 

reference a 
Genbank 

AY274119.3 


Nn m o rn H o 

denot a la CNCM 
du olasmide 

V* Km WIHwIIIImv 

corresoondant 


! SEQ ID NO : 1 


genome de la 
souche issue du 
prelevement 
031589 






SEQ ID NO : 2 


ORF-S* 


21406-25348 




SEQ ID NO : 3 


Proteine S 


_ 


_ 


SEQ ID NO : 4 


! ORF-S** 


21406-25348 


I-3059 


SEQ ID NO : 5 


fragment Sa 


21406-23454 


I-3020 


SEQ ID NO : 6 


fragment Sb 


23322-25348 


1-3019 


SEQ ID NO : 7 


ORF-3+ORF-4* 


25110-26244 




SEQ ID NO : 8 


ORF-3+ORF-4** 


25110-26244 


1-3126 


I SEQ ID NO : 9 


ORF3 






SEQ ID NO : 10 


Proteine ORF-3 






SEQ ID NO : 11 


ORF4 






SEQ ID NO : 12 


Proteine ORF-4 






SEQ ID NO : 13 


ORF-E* 


26082-26413 




SEQ ID NO : 14 


Proteine E 






SEQ ID NO : 15 


ORF-E** 


26082-26413 


I-3046 


SEQ ID NO : 16 


ORF-M* 


26330-27098 




SEQ ID NO : 17 


Proteine M 






SEQ ID NO : 18 


ORF-M** 


26330-27098 


I-3047 


SEQ ID NO : 19 


ORF7a 11* 


26977-28218 




SEQ ID NO : 20 


ORF7a 11** 


26977-28218 


1-3125 


SEQ ID NO : 21 


ORF7 






SEQ ID NO : 22 


Proteine ORF7 






SEQ ID NO : 23 


ORF8 






SEQ ID NO : 24 


Proteine ORF8 






SEQ ID NO : 25 


ORF9 
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SEQ ID NO : 26 


Proteine ORF9 


- 


- 


SEQ ID NO : 27 


ORF10 


- 


- 


SEQ ID NO : 28 


Proteine ORF10 


- 


- 


SEQ ID NO : 29 


ORF11 




- 


SEQ ID NO : 30 


Proteine ORF1 1 


_ 


- 


SEQ ID NO: 31 


OrFlab 


265-21485 


- 


SEQ ID NO : 32 


ORF13 


28130-28426 


- 


SEQ ID NO : 33 


Proteine ORF13 


- 


- 


SEQ ID NO : 34 


ORF14 




- 


SEQ ID NO : 35 


Proteine ORF14 


28583-28795 




SEQ ID NO : 36 


ORF-N* 


28054-29430 




SEQ ID NO : 37 


Proteine N 


_ 


- 


SEQ ID NO : 38 


ORF-N** 


28054-29430 


I-3048 


SEQ ID NO : 39 


5'non-codante** 


1-204 


1-3124 


SEQ ID NO : 40 


3'non-codante** 


28933-29727 


1-3123 


SEQ ID NO : 41 


ORFlab 

Fragment L0 


30-500 


- 


SEQ ID NO : 42 


Fragment L1 


211-2260 


- 


SEQ ID NO : 43 


Fragment L2 


2136-4187 


- 


SEQ ID NO : 44 


Fragment L3 


3892-5344 


- 


SEQ ID NO : 45 


Fragment L4b 


4932-6043 


- 


SEQ ID NO : 46 


Fragment L4 


5305-7318 


- 


SEQ ID NO : 47 


Fragment L5 


7275-9176 


- 


SEQ ID NO : 48 


Fragment L6 


9032-11086 


- 


SEQ ID NO : 49 


Fragment L7 


10298-12982 


- 


SEQ ID NO : 50 


Fragment L8 


12815-14854 




SEQ ID NO : 51 


Fragment L9 


14745-16646 


- 


SEQ ID NO : 52 


Fragment L10 


16514-18590 


- 


SEQ ID NO : 53 


Fragment L1 1 


18500-20602 


- 


SEQ ID NO : 54 


Fragment L12 


20319-22224 




SEQ ID NO : 55 


Amorce N sens 


- 


- 


SEQ ID NO : 56 


Amorce N 
antisens 






SEQ ID NO : 57 


Amorce S c sens 






SEQ ID NO : 58 


Amorce Sl sens 


- 


- 


SEQ ID NO : 59 


Amorce Sc e t Sl 
antisens 






SEQ ID NO : 60 


Amorce sens 
serie 1 


28507-28522 




SEQ ID NO : 61 


Amorce antisens 
serie 1 


28774-28759 




SEQ ID NO : 62 


Amorce sens 
serie 2 


28375-28390 




SEQ ID NO : 63 


Amorce antisens 
serie 2 


28702-28687 




SEQ ID NO : 64 


Sonde 1 /serie 1 


28561-28586 
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SEQ ID NO : 65 


Sonde 2/serie 1 


28588-28608 


_ 


SEQ ID NO : 66 


Sonde 1/serie 2 


28541-28563 


_ 


SEQ ID NO : 67 


Sonde 2/serie 2 


28565-28589 




SEQ ID NO : 68 


Amorce ancre 
14T 






SEQ ID NO : 69 


Peptide M2-14 


- 




SEQ ID NO : 70 


Peptide E1-12 


- 


_ 


! SEQ ID NO : 71 


Peptide E53-76 


- 




SEQ ID NO : 72 


5'non-codante* 


1-204 


- 


SEQ ID NO : 73 


3'non-codante* 


28933-29727 


_ 


SEQ ID NO : 74 


Proteine ORF1a 


- 




SEQ ID NO : 75 


Proteine ORF1b 


- 


_ 


SEQ ID NO:76-139 


Amorces 






SEQ ID NO:140 


Pseudogene de S 






SEQ ID NO:141-148 


amorces 






SEQ ID NO:149 


Aa1-13de S 






SEQ ID NO: 150 


polypeptide 






SEQ ID NO:151-158 


amorces 







































* produit d'amplification PCR (amplicon) 
** insert clone dans le plasmide depos6 a la CNCM 
ainsi qu'aux dessins annexes dans lesquels : 



• la figure 1 illustre Paralyse par Western-blot de Pexpression in 
5 vitro des proteines recombinantes N, S c et S L k partir des vecteurs d'expression 
pIVEX. Piste 1 : pIV2.3N. Piste 2 : pIV2.3S c . Piste 3 : pIV2.3S L . Piste 4 : pIV2.4N. 
Piste 5 : pIV2.4Si ou pIV2.4S c . Piste 6 : pIV2.4S L . L'expression de la proline GFP 
exprim^e k partir du meme vecteur est utilisee comme controle. 

- la figure 2 illustre Paralyse par 61ectrophor6se en gel de 
10 polyacrylamide en conditions d^naturantes (SDS-PAGE) et coloration au bleu de 
Coomassie, de l'expression in vivo de la proteine N k partir des vecteurs d'expression 
pIVEX. La souche d'Rcoli BL21(DE3)pDIA17 transform^ par les vecteurs pIVEX 
recombinants est cultivSe k 30°C dans du milieu LB, en presence ou en l'absence 
dMnducteur (IPTG ImM). Piste 1 : pIV2.3N Piste 2 : pIV2.4N. 
15 - la figure 3 illustre Panalyse par electrophordse en gel de 

polyacrylamide en conditions d6naturantes (SDS-PAGE) et coloration au bleu de 
Coomassie, de Pexpression in vivo des polypeptides Sl et Sc k partir des vecteurs 
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^expression pIVEX. La souche d'Rcoli BL21(DE3)pDIA17 transform^ par les 
vecteurs pIVEX recombinants est cultivate k 30°C dans du milieu LB, en presence ou 
en Pabsence d'inducteur (IPTG imM). Piste 1 : pIV2.3S c Piste 2 : pIV2.3S L . Piste 3 : 
pIV2.4Si Piste 4 : pIV2.4S L . 
5 - la figure 4 illustre l'activite antig&iique des prolines N, S L et Sc 

recombinantes produites dans la souche E. coli BL21(DE3)pDIA17 transform^ par 
les vecteurs pIVEX recombinants. A : electrophorese (SDS-PAGE) des lysats bacte- 
riens. B et C : Westem-blot avec les serums, provenant d'un meme patient infecte par 
le SARS-CoV, pr^leves respectivement 8 jours (B : sfrum Ml 2) et 29 jours-(C : 
10 s6rum Ml 3) apres le debut des symptdmes du SRAS. Piste 1 : pIV2.3N. Piste 2 : 
pIV2.4N. Piste 3 : pr/2.3S c . Piste 4 : pIV2.4 Sj. Piste 5 : pIV2.3S L . Piste 6 : pIV2.4S L 

- la figure 5 illustre la purification sur colonne Ni-NTA agarose de la 
proline N recombinante produite dans la souche E. coli BL21(DE3)pDIA17 a partir 
du vecteur pIV2.3N. Piste 1 : Extrait bacterien total. Piste 2 : Extrait soluble. Piste 3 : 

15 Extrait insoluble. Piste 4 : Extrait d6pose sur la colonne Ni-NTA. Piste 5 : proteines 
non-retenues. Piste 6 : Fractions du pic 1. Piste 7 : Fractions du pic 2. 

- la figure 6 illustre la purification de la proteine Sc recombinante a 
partir des corps d'inclusions produits dans la souche E. coli BL21(DE3)pDIA17 trans- 
form^ par le pIV2.4Si.A. Traitement au Triton X-100 (2%) : Piste 1 : Extrait bacte- 

20 rien total. Piste 2 : Extrait soluble. Piste 3 : Extrait insoluble. Piste 4 : Surnageant 
aprds traitement au Triton X-100 (2 %). Pistes 5 et 6 : Culot aprds traitement au Triton 
X-100 (2 %).B : Traitement a Puree 4M, 5M, 6M et 7M des extraits solubles et inso- 
lubles. 

- la figure 7 repr6sente Timrnxmoempreinte r^alisee k l'aide d'un 
25 lysat de cellules infectees par le SARS-CoV et d'un s6rum de patient atteint de 

pneumopathie atypique. 

- la figure 8 repr^sente des immunoempreintes r6alis£es k l'aide 
d'un lysat de cellules infectees par le SARS-CoV et d'immunserums de lapins speci- 
fiques de la nucteoproteine N (A) et de la proteine de spicule S (B). LS. : serum 
30 immun. p.i. : s6rum pte-immun. L'immuns6rum anti-N a 6te utilise au 1/50000 et 
l'immunserum anti-S au 1/10000. 
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- la figure 9 illustre la r<§activite en ELISA des scrums polyclonaux 
monosp6cifiques de lapin dirig6s contre la proline N ou le fragment court de la 
proline S (Sc), vis-a-vis des prolines recombinantes correspondantes utilises pour 
l'immunisation. A : lapins P13097, P13081, et P13031 immunises avec la proteine N 

5 recombinante purifie. B : lapins PI 1135, P13042, et P14001 immunises avec une 
preparation de corps d' inclusions correspondants au fragment court de la proteine S 
(Sc). I.S. : serum immun. p.i. : s^rum pr£-immun. 

- la figure 10 illustre la r6activit<§ en ELISA de la proteine N 
recombinante purifiee, vis-&-vis de serum de patients atteints de pneumonie atypique 

10 causae par le SARS-CoV. Figure 10a : plaques ELISA prepares avec la proteine N & la 
concentration de 4 ^g/ml et 2 jag/ml. Figure 10b : plaque ELISA pnJparee avec la 
proteine N & la concentration de 1 jxg/ml. Les serums designes A, B, D, E, F, G, H 
correspondent k ceux du Tableau IV. 

- la figure 11 illustre 1' amplification par RT-PCR de quantity 
15 d^croissantes d'ARN synthetique du g£ne N du SARS-CoV (10 7 h 1 copie), a l'aide 

des couples d'amorces n° 1 (N/+/28507 > N/-/28774) (A) et n° 2 (N/+/28375,N/-/28702) 
(B). T : amplification realisee en l'absence d'ARN. MW : marqueur d'ADN. 

- la figure 12 illustre 1* amplification par RT-PCR en temps r6el 
d ! ARN synthetique du gdne N du SARS-CoV : des quantites d^croissantes d'ARN 
20 synthetique en r6pliquat (repli. ; pistes 16 a 29) ainsi que de 1 ! ARN viral dilue au 
1/20x1 0" 4 (piste 32) ont 6t6 amplifies par RT-PCR en temps rSel a l'aide du kit "Light 
Cycler RNA Amplification Kit Hybridization Probes" et des couples d'amorces et de 
sondes de la serie n° 2, dans les conditions decrites k Texemple 8. 

- la figure 13 (figure 13.1 h 13.70) repr^sente la carte de restriction 
25 de la sequence SEQ ID NO : 1 correspondant a Equivalent ADN du genome de la 

souche de SARS-CoV issue du prelevement repertorte sous le num&ro 031589. 

- la figure 14 montre le resultat du test de serologic SRAS par 
ELISA N indirect (l£re serie de serums testes) 

- la figure 15 montre le resultat du test de sSrologie SRAS par 
30 ELISA N indirect (2eme s6rie de serums testes) 
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- la figure 16 pr£sente le r6sultat du test de serologic SRAS par 
ELISA N double epitope (lere serie de scrums testes) 

- la figure 17 montre le tesultat du test de sSrologie SRAS par 
ELISA N double Epitope (2eme s&ie de s6rums testes) 

5 - la figure 1 8 illustre le test de reactivity des anticorps monoclonaux 

anti-N par ELISA sur la nucleoproteine N native du SRAS-CoV. Les anticorps ont &l€ 
testes sous la forme de surnageants de culture d'hybridomes par un ELISA indirect 
utilisant un lysat irradte de cellules VeroE6 infectees par le SRAS-CoV comme 
antig&ie (courbes lysat SRAS). Un controle negatif de reactivite est realise pour 
10 chaque anticorps sur un lysat de cellules VeroE6 non infectees (courbes lysat negatif). 
Plusieurs anticorps monoclonaux de spScificite connue ont ete utilises comme 
anticorps temoins negatifs : paral-3 dirig£ contre les antigdnes des virus parainfluenza 
de type 1-3 (Bio-Rad) et grippe B dirige contre les antigenes du virus de la grippe de 
type B (Bio-Rad). 

15 - la figure 19 illustre le test de reactivite des anticorps monoclonaux 

anti-N du SRAS-CoV par ELISA sur les antigdnes natifs du coronavirus humain 229E 
(HCoV-229E). Les anticorps ont ete testes sous la forme de surnageants de culture 
d'hybridomes par un test ELISA indirect utilisant un lysat de cellules MRC-5 
infectees par le coronavirus humain 229E comme antigfene (courbes lysat 229E). Un 

20 contrSle n6gatif d'immunor£activite est realise pour chaque anticorps sur un lysat de 
cellules MRC-5 non infectees (courbes lysat negatif). L' anticorps monoclonal 5-1 1H.6 
dirig<§ contre la proteine S du coronavirus humain 229E (Sizun et al. 1998, J. Virol. 
Met. 72 : 145-152) est utilise comme anticorps temoin positif. Les anticorps paral-3 
dirige contre les antigenes des virus parainfluenza de type 1-3 (Bio-Rad) et grippe B 

25 dirigS contre les antig&ies du virus de la grippe de type B (Bio-Rad) ont 6te ajoutes au 
panel des anticorps monoclonaux testes. 

- la figure 20 montre un test de reactivite des anticorps monoclonaux 
anti-N du SRAS-CoV par western blot sur la nucteoproteine N native du SRAS-CoV 
d£natur6e. Un lysat de cellules VeroE6 infectees par le SRAS-CoV a ete prepare dans 

30 le tampon de d6pot selon Laemmli et mis k migrer dans un gel SDS k 12% de 
polyacrylamide puis les proteines ont 6t6 transferees sur membrane de PVDF. Les 
anticorps monoclonaux anti-N testes ont 6t6 utilises pour Timmunoessai $l la concen- 
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tration de 0.05 |ag/ml. La revelation est faite avec des anticorps anti-IgG(H+L) de 
souris couples k la peroxydase (NA93IV, Amersham) et le systeme ECL+. Deux anti- 
corps monoclonaux ont ete utilises comme t£moins n^gatifs de reactivite : grippe B 
dirig£ contre les antigenes du virus de la grippe de type B (Bio-Rad) et paral-3 dirig6 
5 contre les antigenes des virus parainfluenza de type 1-3 (Bio-Rad). 

- la figure 21 presente les plasmides d' expression en cellules de 
mammiferes de la proteine S du SRAS-CoV. Le cDNA de la S du SRAS-CoV a Ste 
ins6r6 entre les sites BamHl et Xhol du plasmide d' expression pcDNA3.1(+) 
(Clontech) pour obtenir le plasmide pcDNA-S et entre les sites Nhel et Xhol du 

10 plasmide d'expression pCI (Promega) pour obtenir le plasmide pCI-S. Les sequences 
WPRE et CTE ont ete inserees dans chacun des deux plasmides pcDNA-S et pCI-S 
entre les sites Xhol et Xbal pour obtenir respectivement les plasmides pcDNA-S- 
CTE, pcDNA-S-WPRE, pCI-S-CTE et pCI-S-WPRE. 

SP : peptide signal predit (aa 1-13) avec le logiciel signalP v2.0 
15 (Nielsen et al., 1997, Protein Engineering, 10:1-6) 

TM : region transmembranaire predite (aa 1196-1218) avec le 
logiciel TMHMM v2.0 (Sonnhammer et al., 1998, Proc. of Sixth Int. Conf. on 
Intelligent Systems for Molecular Biology, p 175-182, AAA! Press). II faut noter que 
les acides amines W1194 et PI 195 font possiblement partie de la region trans- 
20 membranaire avec des probability respectives de 0,13 et 0,42 

P-CMV : promoteur imm6diat/pr6coce du cytomegalovirus. BGH 
pA : signal de polyadenylation du g&ie de l'hormone de croissance bovine 

SV40 late pA : signal de polyadenylation tardif du virus SV40 
SD/SA : sites donneur et accepteur d'£pissage 
25 WPRE : sequences du "Woodchuck Hepatitis Virus posttranscriptio- 

nal regulatory element" du virus de Thepatite de la marmotte 

CTE : sequences du "constitutive transport element" du retrovirus 
simien de Mason-Pfizer 

- la figure 22 illustre l'expression de la proteine S apr£s transfection 
30 de cellules VeroE6. Des extraits cellulaires ont ete prepares 48 heures apres transfec- 
tion de cellules VeroE6 par les plasmides pcDNA, pcDNA-S, pCI et pCI-S. Des 
extraits cellulaires ont 6galement 6t6 prepares 18 heures apres infection par le virus 
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recombinant de la vaccine W-TF7.3 et transfection par les plasmides pcDNA ou 
pcDNA-S. A titre de controle, des extraits de cellules VeroE6 ont et6 prepares 8 
heures apres infection par le SRAS-CoV a une multiplicity d'infection de 3. lis ont ete 
separes sur un gel SDS a 8% d'acrylamide et analyses par western blot a l'aide d'un 
5 anticorps polyclonal de lapin anti-S et d'un anticorps polyclonal anti-IgG(H+L) de 
lapin couple a la peroxidase (NA934V, Amersham). Une echelle de masse moteculaire 
(kDa) est portee sur la figure. 

SRAS-CoV : extrait de cellules VeroE6 infectees par le SRAS-CoV 
Mock : extrait controle de cellules non infectees 
10 - la figure 23 illustre l'effet des sequences CTE et WPRE sur 

V expression de la proteine S apres transfection de cellules VeroE6 et 293T. Des 
extraits cellulaires ont ete prepares 48 heures apres transfection de cellules VeroE6 (A) 
ou 293T (B) par les plasmides pcDNA, pcDNA-S, pcDNA-S-CTE, pcDNA-S-WPRE, 
pCI-S, pCI-S-CTE et pCI-S-WPRE, separes sur un gel SDS a 8% d'acrylamide et 
15 analyses par western blot a l'aide d'un anticorps polyclonal de lapin anti-S et d'un 
anticorps polyclonal anti-IgG(H+L) de lapin couple a la peroxidase (NA934V, 
Amersham). Une echelle de masse moleculaire (kDa) est portee sur la figure. 

SRAS-CoV : extrait de cellules VeroE6 prepares 8 heures apres 
infection par le SRAS-CoV a une multiplicity d'infection de 3. 
20 Mock : extrait contr61e de cellules VeroE6 non infectees 

- la figure 24 presente des vecteurs lentiviraux defectifs a DNA flap 
central pour l'expression de la S du SRAS-CoV. Le cADN de la proteine S du SRAS- 
CoV a ete clone sous la forme d'un fragment BamHl-Xhol dans le plasmide 
pTRIPAU3-CMV contenant un vecteur lentiviral defectif TRIP a DNA flap central 
25 (Sirven et al, 2001, Mol. Ther., 3 :438-448) pour obtenir le plasmide pTRIP-S. Les 
cassettes d'expression optimales constituees du promoteur immediat/precoce du virus 
CMV, d'un signal d'epissage, du cDNA de la S et de Tun ou l'autre des signaux post- 
transcriptionnels CTE ou WPRE ont ete substitutes a la cassette EFla-EGFP du 
vecteur d'expression lentiviral defectif a DNA FLAP central TRIPAU3-EF1 a (Sirven 
30 et al, 2001, Mol. Ther., 3 :438-448) pour obtenir les plasmides pTRIP-SD/SA-S-CTE 
et pTRIP-SD/SA-S-WPRE. 

SP : peptide signal 



WO 2005/056584 



PCT7FR2004/003106 



38 

TM : region transmembranaire 

P-CMV : promoteur immSdiat/precoce du cytomegalovirus 

P-EFla : promoteur du g&ne EFla 

SD/SA : sites donneur et accepteur d'epissage 
5 WPRE : sequences du "Woodchuck Hepatitis Virus posttranscrip- 

tional regulatory element" du virus de l'tepatite de la marmotte 

CTE : sequences du "constitutive transport element" du retrovirus 
simien de Mason-Pfizer 

LTR : « Long terminal repeat » 
10 AU3 : LTR delete des sequences « promoter/enhancer » 

cPPT : « polypurine tract cis-active sequence » 

CTS : « central termination sequence » 

-la figure 25 montre 1'analyse par western blot de r expression de la 
S du SRAS-CoV par des lignees cellulaires transduites par les vecteurs lentiviraux 

15 TRIP-SD/SA-S-WPRE et TRIP-SD/SA-S-CTE. Des extraits cellulaires ont 6t6 
prepares a partir de lignees FrhK4-S-CTE et FrhK4-S-WPRE etablies apres transduc- 
tion par les vecteurs lentiviraux TRIP-SD/SA-S-CTE et TRIP-SD /SA-S-WPRE 
respectivement. lis ont 6t6 s6pares sur un gel SDS a 8% d'acrylamide et analyses par 
western blot k Taide d'un anticorps polyclonal de lapin anti-S et d'un conjugue anti- 

20 IgG(H+L) de lapin couple k la peroxidase. Une <§chelle de masse moleculaire (icDa) 
est portee sur la figure. 

T- : extrait controle de cellules FrhK-4 

T+ : extrait de cellules FrhK-4 preparees 24h apr6s infection par le 
SRAS-CoV k line multiplicity d'infection de 3. 

25 - la figure 26 concerne 1'analyse de l'expression de polypeptide Ssol 

par des lign6es cellulaires transduites par les vecteurs lentiviraux TRIP-SD/SA-Ssol- 
WPRE et TRIP-SD/SA-Ssol-CTE. La secretion du polypeptide Ssol a ete recherch&s 
dans le surnageant d'une s&ie de clones cellulaires isoles aprds transduction de 
cellules FRhK-4 par les vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et TRIP- 

30 SD/SA-Ssol-CTE. 5 \xl de surnageant diluSs au 1/2 dans du tampon de d6pot selon 
Laemmli ont 6t6 analyses par western blot revile par un anticorps monoclonal anti- 
FLAG (M2, Sigma) et un conjugue anti-IgG(H+L) de souris coupl6 k la peroxidase. 
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T- : surnageant de la lign<§e FRhK-4 parentale. T+ : surnageant de cellules BHK 
infectees par un virus recombinant de la vaccine exprimant le polypeptide Ssol. La 
fteche pleine indique le polypeptide Ssol, tandis que la fteche creuse indique une 
reaction crois^e avec une proteine d'origine cellulaire. 
5 - la figure 27 montre les resultats relatifs a Tanalyse du polypeptide 

Ssol purifie 

A. 8, 2, 0.5 et 0.125 fig de polypeptide recombinant Ssol purifie par 
chromatographic d'affinite anti-FLAG et gel filtration (G75) ont ete s6par6s sur gel 
SDS a 8% de polyacrylamide. Le polypeptide Ssol ainsi que des quantites variables de 

10 marqueurs de masse moleculaire (MM) ont ete rev£16s par coloration au nitrate 
d'argent (Gelcode SilverSNAP stain kit II, Pierce). 

B. Marqueurs etalons pour 1'analyse par spectrometrie de masse 

SELDI-TOF 

IgG : IgG bovine de MM 147300 
15 ConA : conalbumine de MM 77490 

HRP : peroxidase de raifort analys6e a titre de controle et de MM 

43240 

C. Analyse par spectrometrie de masse (SELDI-TOF) du poly- 
peptide recombinant Ssol. 

20 Les pics A et B correspondent au polypeptide Ssol simplement et 

doublement charge. 

D. Sequenfage de Pextr&nite N-terminale du polypeptide 
recombinant Ssol. 5 cycles de degradation d'Edman en phase liquide ont ete realises 
sur un sequenceur ABI494 (Applied Biosystems). 

25 - la figure 28 illustre Tinfluence d'un signal d'epissage et des 

sequences CTE et WPRE sur l'efficacite de 1' immunisation genique a Taide d'ADN 
plasmidique codant la S du SRAS-CoV 

A.Des groupes de 7 souris BALB/c ont ete immunises a deux 
reprises k 4 semaines d'intervalle a Taide de 50 |ug d'ADN plasmidique de pCI, 

30 pcDNA-S, pCI-S, pcDNA-N et pCI-HA. 
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B. Des groupes de 6 souris BALB/c ont ete immunises k deux 
reprises a 4 semaines d'intervalle a l'aide de 2 \ig, 10|ig ou 50 jag d'ADN plasmidique 
de pCI, pCI-S, pCI-S-CTE et pCI-S-WPRE. 

Les serums immuns preleves 3 semaines apres la deuxieme immuni- 
5 sation ont ete analyses par ELISA indirect en utilisant un lysat de cellules VeroE6 
infectees par le SRAS-CoV comme antigene. Les titres en anticorps anti-SRAS-CoV 
sont calculus comme l'inverse de la dilution produisant une DO specifique de 0,5 
apres revelation par un anticorps polyclonal anti-IgG de souris couple a la peroxidase 
(NA931V, Amersham) et du TMB (KPL). 

10 - la figure 29 montre la seroneutralisation de l'infectivite du SRAS- 

CoV par les anticorps induits chez la souris apr£s immunisation genique a l'aide 
d'ADN plasmidique codant la S du SRAS-CoV. Des pools de scrums immuns 
preleves 3 semaines apr£s la deuxieme immunisation ont ete realises pour chacun des 
groupes des experiences decrites dans la figure 28 et evalues pour leur capacite a 

15 seroneutraliser rinfectivite de 100 TCID50 du SRAS-CoV sur cellules FRhK-4. 4 
points sont realises pour chacune des dilutions de raison 2 testes a partir du 1/20. Le 
titre seroneutralisant est calcuie selon la methode de Reed et Munsch comme l'inverse 
de la dilution neutralisant Tinfectivite de 2 cupules sur 4. 

A. Groupes de souris BALB/c immunises k deux reprises a 4 
20 semaines d'intervalle k l'aide de 50 |ig d'ADN plasmidique de pCI, pcDNA-S 3 pCI-S, 

pcDNA-N et pCI-HA. □ : serum preimmun. m : serum immun. 

B. Groupes de souris BALB/c immunises k deux reprises a 4 
semaines d'intervalle k l'aide de 2 jig, 10|ig ou 50 ^ig d'ADN plasmidique de pCI, 
pCI-S, pCI-S-CTE et pCI-S-WPRE. 

25 - la figure 30 illustre Timmunoreactivite du polypeptide recombinant 

Ssol vis k vis de serums de patients atteints de SRAS. La reactivite de serums de 
patients a ete analysee par test ELISA indirect contre des phases solides prepares a 
l'aide du polypeptide recombinant Ssol purifie. Les anticorps de patients reagissant 
avec la phase solide a une dilution de 1/400 sont reveies par xm anticorps polyclonal 

30 anti-IgG(H+L) humain couple a la peroxidase (Amersham NA933V) et du TMB plus 
H202 (KPL). Les serums de cas probables de SRAS sont identifies par un numero 
d'ordre du Centre National de Reference des Virus Influenzae ainsi que par les 
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initiales du patient et le nombre de jours ecouies depuis le debut des symptdmes, le 
cas echeant. Les scrums TV sont des scrums temoins de sujets qui ont ete pr^leves en 
France avant l'epiddmie de SRAS survenue en 2003. 

- La figure 31 montre l'induction d'anticorps dirig^s contre le SRAS- 
5 CoV apres immunisation avec le polypeptide recombinant Ssol. Deux groupe de 6 

souris ont ete immunises k 3 semaines d'intervalle avec 10 jag de polypeptide recom- 
binant Ssol (groupe Ssol) adjuve avec de l'hydroxyde d'aluminium ou, a titre de 
controle, de Tadjuvant seul (groupe mock).Trois immunisations successives ont 6t6 
r^alis^es et les scrums immuns ont ete pr^leves 3 semaines apres chacune des trois 

10 immunisations (IS1, IS2, IS3). Les scrums immuns ont ete analyses par pool pour 
chacun des 2 groupes par ELISA indirect en utilisant un lysat de cellules VeroE6 
infect6es par le SRAS-CoV comme antigene. Les titres en anticorps anti-SRAS-CoV 
sont calculus comme Tinverse de la dilution produisant une DO specifique de 0,5 
apres revelation par un anticorps polyclonal anti-IgG de souris couple a la peroxidase 

1 5 (Amersham) et du TMB (KPL). 

- La figure 32 pr^sente l'alignement nucleotidique des sequences du 
g£ne synthetique 040530 avec la sequence du gene sauvage de Pisolat 031589 du 
SRAS-CoV. 1-3059 correspond aux nucleotides 21406-25348 de l'isolat 031589 du 
SRAS-CoV depose k la C.N.C.M. sous le num6ro 1-3059 (SEQ ID NO : 4, plasmide 

20 pSRAS-S). S-040530 est la sequence du gene synthetique 040530. 

- la figure 33 illustre l'utilisation d'un gene synthetique pour 
l'expression de la S du SRAS-CoV. Des extraits cellulaires prepares 48 heures apres 
transfection de cellulesVeroE6 (A) ou 293T (B) par les plasmides pCI, pCI-S, pCI-S- 
CTE, pCI-S-WPRE et pCI-Ssynth ont ete s^par^s sur un gel SDS & 8% d'acrylamide 

25 et analyses par western blot a l'aide d'un anticorps polyclonal de lapin anti-S et d'un 
anticorps polyclonal anti-IgG(H+L) de lapin couple a la peroxidase (NA934V, 
Amersham). Le western blot est r6veie par luminescence (ECL+, Amersham) et 
acquisition sur un dispositif d'imagerie numerique (FluorS, BioRad). Les niveaux 
d'expression de la proteine S ont ete mesures en quantifiant les 2 bandes majoritaires 

30 reperees surl'image. 

- la figure 34 presente un schema de la construction des virus 
vaccine recombinants VV-TG-S, VV-TG-Ssol, W-TN-S et VV-TN-Ssol 
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A. Les cDNA de la prot&ne S et du polypeptide Ssol du SRAS-CoV 
ont et<§ insere entre les sites BamHl et Smal du plasmide de transfer! pTG186 pour 
obtenir les plasmides pTG-S et pTG-Ssol. 

B. Les sequences du promoteur synth&ique 480 ont ensuite 6t6 
5 substitutes h celles du promoteur 7.5 par echange du fragment Ndel-Pstl des 

plasmides pTG186poly, pTG-S et pTG-Ssol pour obtenir les plasmides de transfert 
pTN480, pTN-S et pTN -Ssol. 

C. Sequence du promoteur synthetique 480 tel que contenu entre les 
sites Ndel et Pstl des plasmides de transfert de la s6rie pTN. Un site Ascl a 6t€ insere 

10 pour faciliter les manipulations ult&ieures. Les sites de restriction ainsi que la 
sequence du promoteur sont soulignts 

D. Les virus recombinants de la vaccine sont obtenus par double 
recombinaison homologue in vivo entre la cassette TK des plasmides de transfert des 
series pTG et pTN et le gdne TK de la souche Copenhague du virus de la vaccine. 

15 SP : peptide signal predit (aa 1-13) avec le logiciel signalP v2.0 

(Nielsen et al., 1997, Protein Engineering, 10 : 1-6) 

TM : region transmembranaire predite (aa 1196-1218) avec le 
logiciel TMHMM v2.0 (Sonnhammer et al., 1998, Proc. of Sixth Int. Conf. on 
Intelligent Systems for Molecular Biology, p 175-182, AAA! Press). II faut noter que 
20 les acides amines W1194 et PI 195 font possiblement partie de la region trans- 
membranaire avec des probability respectives de 0,13 et 0,42. 

TK-L, TK-R : parties gauche et droite du g&ne de la thymidine 
kinase du virus de la vaccine 

MCS : site multiple de clonage 
25 PE : promoteur precoce 

PL : promoteur tardif 

PL synth : promoteur tardif synthetique 480 

- la figure 35 illustre Texpression de la proline S par les virus 
vaccine recombinants, analysee par western blot. Des extraits cellulaires ont et6 pr6pa- 
30 r6s 18 heures apres infection de cellules CV1 par les virus vaccine recombinants W- 
TG, VV-TG-S et VV-TN-S k une M.O.I, de 2 (A). A titre de controle, des extraits de 
cellules VeroE6 ont 6t6 prepares 8 heures apres infection par le SRAS-CoV k une 
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multiplicity d'infection de 2. Des extraits cellulaires ont (Sgalement et<§ pr6par<§s 18 
heures apres infection de cellules CV1 par les virus vaccine recombinants W-TG-S, 
W-TG-Ssol, VV-TN, VV-TN-S et W-TN-Ssol (B). lis ont 6t6 separes sur des gels 
SDS k 8% d'acrylamide et analyses par western blot k Taide d'un anticorps polyclonal 
5 de lapin anti-S et d'un anticorps polyclonal anti-IgG(H+L) de lapin coupte k la 
peroxidase (NA934V, Amersham). « Ijal » et « lOjal » indique les quantites d'extraits 
cellulaires deposees sur le gel. Une 6chelle de masse moteculaire (kDa) est port<§e sur 
la figure. 

SRAS-CoV : extrait de cellules VeroE6 infectives par le SRAS-CoV 
10 Mock : extrait controle de cellules non infectees 

- la figure 36 montre le resultat d'une analyse par western blot de la 
s6cr6tion du polypeptide Ssol par les virus vaccine recombinants. 

A. Des surnageants de cellules CV1 infectees par le virus vaccine 
recombinant W-TN, differents clones du virus VV-TN-Ssol et par les virus VV-TG- 

15 Ssol ou VV-TN-Sflag ont ete recoils 18 heures apres infection de cellules CV1 a une 
M.O.I. de 2. 

B. Des surnageants de cellules 293T, FRhK-4, BHK-21 et CV1 
infectees en dupliques (1,2) par le virus vaccine recombinant VV-TN-Ssol a une M 
.O.I. de 2 ont ete recolt^s 18 heures apres infection. Le surnageant de cellules CV1 

20 infectees par le virus W-TN a egalement 6t6 recolte a titre de controle (M). 

Tous les surnageants ont ete separes sur un gel SDS k 8% 
d'acrylamide selon Laemmli et analyses par western blot a Taide d'un anticorps 
monoclonal de souris anti-FLAG et d'un anticorps polyclonal anti-IgG(H+L) de souris 
couple a la peroxidase (NA931V, Amersham) (A) ou k Taide d'un anticorps poly- 
25 clonal de lapin anti-S et d'un anticorps polyclonal anti-IgG(H+L) de lapin couple a la 
peroxidase (NA934V, Amersham) (B). 

Une Schelle de masse moteculaire (kDa) est portee sur la figure. 

- la figure 37 montre 1'analyse du polypeptide Ssol, purifte par gel 
SDS de polyacrylamide 

30 10, 5 et 2 pi de polypeptide recombinant Ssol purifie par chromato- 

graphic d'affinite anti-FLAG ont 6t6 s6par£s sur gel SDS en gradient de 4 k 15 % de 
polyacrylamide. Le polypeptide Ssol ainsi que des quantites variables de marqueurs de 
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masse mol^culaire (MM) ont 6t6 rev6\6s par coloration au nitrate d'argent (Gelcode 
SilverSNAP stain kit II, Pierce). 

- la figure 38 illustre Timmunoreactivite du polypeptide recombinant 
Ssol produit par le virus vaccine recombinant W-TN-Ssol vis-4-vis de serums de 
5 patients atteints de SRAS. La r6activit6 de serums de patients a 6te analysee par test 
ELISA indirect contre des phases solides pr£par6es k Taide du polypeptide recombi- 
nant Ssol purifie. Les anticorps de patients reagissant avec la phase solide a une 
dilution de 1/100 et 1/400 sont rev616s par un anticorps polyclonal anti-IgG(H+L) 
humain couple a la peroxidase (Amersham NA933V) et du TMB plus H202 (KPL), 

10 Les serums de cas probables de SRAS sont identifies par un numero d'ordre du Centre 
National de Reference des Virus Influenzae ainsi que par les initiales du patient et le 
nombre de jours ecoules depuis le d£but des symptomes, le cas £ch£ant Les serums 
TV sont des serums temoins de sujets qui ont ete pr61ev6s en France avant l'epidemie 
de SRAS survenue en 2003. 

15 - la figure 39 montre la r^ponse en anticorps anti-SRAS-CoV chez la 

souris aprfes immunisation par les virus vaccine recombinants. Des groupes de 7 souris 
BALB/c ont 6t6 immunises par voie i.v. a deux reprises h 4 semaines d'intervalle par 
106 u.f.p. de virus vaccine recombinants W-TG, VV-TG-HA, W-TG-S, VV-TG- 
Ssol, W-TN, W-TN-S, W-TN-Ssol. 

20 A. Des pools de scrums immuns pr61ev6s 3 semaines aprds chacune 

des deux immunisations ont 6te realises pour chacun des groupes et ont €\€ analyses 
par ELISA indirect en utilisant un lysat de cellules VeroE6 infect£es par le SRAS- 
CoV comme antigene. Les titres en anticorps anti-SRAS-CoV sont calcules comme 
Tinverse de la dilution produisant une DO sp^cifique de 0,5 aprds revelation par un 

25 anticorps polyclonal anti-IgG de souris couple a la peroxidase (NA931V, Amersham) 
et du TMB (KPL). 

B. Les pools de s6rums immuns ont 6t6 6valu6s pour leur capacity k 
seroneutraliser l'infectivite de 100 TCID50 du SRAS-CoV sur cellules FRhK-4. 4 
points sont realises pour chacune des dilutions de raison 2 testees a partir du 1/20. Le 

30 titre s£roneutralisant est calculi selon la methode de Reed et Munsch comme Tinverse 
de la dilution neutralisant Tinfectivite de 2 cupules sur 4. 
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- la figure 40 ctecrit la construction des virus recombinants 
MVSchw2-SARS-S et MVSchw2-SARS-Ssol. 

A. Le vecteur rougeole est un genome complet de la souche 
vaccinale Schwarz du virus de la rougeole (MV) dans lequel une unite de transcription 

5 supplemental a ete introduite (Combredet, 2003, Journal of Virology, 77 : 11546- 
11554). L'expression des phases ouvertes de lecture (ORF) suppiementaires est 
contrdlee par les elements agissant en cis necessaires a la transcription, a la forma- 
tion de la coiffe et a la polyad&iylation du transgene, qui ont ete copies des Elements 
presents a la jonction N/P. 2 vecteurs differents permettent l'insertion entre les gSnes 
10 P (phosphoproteine) et M (matrice) d'une part et H (hemagglutinin) et L 
(polymerase) d'autre part. 

B. Les genomes recombinants MVSchw2-SARS-S et MVSchw2- 
SARS-Ssol du virus de la rougeole ont ete constants par l'insertion des ORFs de la 
proline S et du polypeptide Ssol au sein d'une unite de transcription supplementaire 

1 5 localisee entre les genes P et M du vecteur. 

Les differents g£nes du virus de la rougeole (MV) sont indiques : N 
(nucl6oproteine), PVC (phosphoproteine et proteine V/C), M (matrice), F (fusion), H 
(h6magglutinine), L (polymerase). T7 = promoteur de PARN polymerase T7, hh = 
ribozyme hammerhead, T7t = sequence terminatrice de TARN polymerase du phage 

20 T7, d = ribozyme du virus de Thepatite d 9 (2), (3) = unites de transcription suppte- 
mentaires (ATU), 

Taille du genome du MV : 15894 nt. 

SP : peptide signal 

TM : region transmembranaire 
25 FLAG : etiquette FLAG 

- la figure 41 illustre Texpression de la proteine S par les virus 
rougeole recombinants, analysee par western blot 

Des extraits cytoplasmiques ont ete prepares apres infection de 
cellules Vero par differents passages des virus MVSchw2-SARS-S et MVSchw2- 
30 SARS-Ssol et le virus sauvage MWSchw a titre de controle. Des extraits cellulaires en 
tampon de depot selon Laemmli ont egalement ete prepares 8 heures apres infection 
de cellules VeroE6 par le SRAS-CoV a une multiplicite d'infection de 3. lis ont ete 
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s<§par£s sur un gel SDS a 8% d'acrylamide et analyses par western blot a l'aide d'un 
anticorps polyclonal de lapin anti-S et d'un anticorps polyclonal anti-IgG(H+L) de 
lapin couple a la peroxidase (NA934V, Amersham). 

Une echelle de masse moteculaire (kDa) est portee sur la figure. 
5 Pn : nieme passage du virus apres coculture de cellules 293-3-46 et 

Vero. 

SRAS-CoV : extrait de cellules VeroE6 infectees par le SRAS-CoV 
Mock : extrait controle de cellules VeroE6 non infectees 

- la figure 42 montre Texpression de la proteine S par les virus 
1 0 rougeole recombinants, analy see par immunofluorescence 

Des cellules Vero en monocouches sur lamelles de verre ont ete 
infectees par le virus sauvage MWSchw (A) ou les virus MVSchw2-SARS-S (B) et 
MVSchw2-SARS-Ssol (C). Quand les syncytia ont atteint 30 a 40% de confluence 
(A., B.) ou 90-100% (C), les cellules ont 6te fixees, permeabilisees et marquees par 
15 des anticorps polyclonaux de lapins anti-SRAS-CoV et un conjugue anti-IgG(H+L) de 
lapin couple au FITC (Jackson). 

- la figure 43 illustre l'analyse par western blot de 
l'immunoreactivite de scrums de lapins dirigSs contre les peptides El-12, E53-76 et 
M2-14. Le lapin 20047 a ete immunise avec le peptide El-12 couple a la KLH. Les 

20 lapins 22234 et 22240 ont ete immunises avec le peptide E53-76 couple k la KLH. Les 
lapins 20013 et 20080 ont 6t6 immunises avec le peptide M2-14 coupte k la KLH. Les 
immuns&aims ont ete analyses par western blot a l'aide d'extraits de cellules infectees 
par le SRAS-CoV (B) ou a Taide d'extraits de cellules infectees par un virus recombi- 
nant de la vaccine exprimant la proteine E (A) ou M (C) de l'isolat 031589 du SRAS- 
25 CoV. Les immunoempreintes ont 6t6 rSvetees k l'aide d'un conjugue anti-IgG(H+L) 
de lapin couple a la peroxidase (NA934V, Amersham). 

La position des proteines E etM est indiqu6e par une fleche. 
Une Echelle de masse moteculaire (kDa) est portee sur la figure. 
II doit etre bien entendu, toutefois, que ces exemples sont donnes 
30 uniquement a titre d' illustration de 1'objet de Pinvention, dont ils ne constituent en 
aucune maniere une limitation. 
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Exemple 1 : Clonage et sequen?age du genome de la souche de SARS-CoV issue 
du prelevement rSpertorie sous le numero 031589 

L'ARN de la souche de SARS-CoV a ete extrait k partir du prele- 
vement de lavage bronchoalv6olaire r^pertorie sous le numero 031589, effectue sur un 
5 patient de l'hopital fran?ais de Hanoi (Vietnam) atteint de SRAS. 

L'ARN isoie a ete utilise comme matrice pour amplifier les ADNc 
correspondant aux differents cadres ouverts de lecture du genome (ORF la, ORFlb, 
ORF-S, ORF-E, ORF-M, ORF-N (incluant les ORF-13 et ORF-14), ORF3, ORF4, 
ORF7 a ORF 11), et aux extremites 5' et 3' non-codantes. Les sequences des amorces 
10 et des sondes utilises pour V amplification/detection ont ete definies d'apres la 
sequence nucleotidique disponible du SARS-CoV. 

Dans ce qui suit les amorces et les sondes sont identifiees par : la 
lettre S, suivie d'une lettre qui indique la region correspondante du genome (L pour 
Textremite 5'incluant ORFla et ORFlb ; S, M et N pour les ORF-S, ORF-M, ORF-N, 

15 SE et MN pour les regions interg^niques correspondantes), puis eventuellement de Fn, 
Rn, avec n inclus entre 1 et 6 correspondant aux amorces utilisees pour la PGR nichee 
ou imbriqu^e (pake Fl + Rl pour la premiere amplification, paire F2 + R2 pour la 
deuxieme amplification, etc. . ,), puis de /+/ ou /-/ correspondant a une amorce sens ou 
antisens et enfm des positions des amorces en reference a la sequence Genbank 

20 AY27411.3 ; pour les amorces S et N sens et antisens et les autres amorces sens 
uniquement, lorsqu'une seule position est indiqu6e elle correspond a celle de 
l'extremite 5' d'une sonde ou d'une amorce d'environ 20 bases ; pour les amorces 
antisens autres que les amorces S et N, lorsqu'une seule position est indiqu^e elle 
correspond k celle de l'extremite 3' d'une sonde ou d'une amorce d'environ 20 bases. 

25 Les produits d'amplifications ainsi g&ieres ont ete sequences k 

l'aide d'amorces specifiques afin de determiner la sequence complete du genome de la 
souche de SARS-CoV issue du prelevement repertorfe sous le numero 031589. Ces 
produits d' amplification, k l'exception de ceux correspondant aux ORFla et ORFlb, 
ont ensuite ete clones dans des vecteurs d'expression afin de produire les proteines 

30 virales correspondantes et les anticorps diriges contre ces proteines, notamment par 
immunisation k base d'ADN. 
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1. Extraction des ARN 

Les ARN ont ete extraits a V aide du kit QIamp viral RNA extraction 
mini (QIAGEN) en suivant les recommandations du fabricant De maniere plus 
precise : 140 ^1 du preievement et 560 \x\ de tampon AVL ont ete melanges vigoureu- 
5 sement pendant 15 secondes, incubus 10 min a temperature ambiante puis centrifuges 
brievement a vitesse maximale. 560 jal d'ethanol a 100% ont ete ajoutes au surnageant 
et le melange ainsi obtenu a ete agite tr£s vigoureusement pendant 15 sec. 630 jal du 
melange ont ensuite 6t€ deposes sur la colonne. 

La colonne a 6t6 plac6e sur un tube de 2 ml, centrifugee 1 min a 

10 8000 rpm, puis le reste du melange precedent a ete depose sur la meme colonne, 
centrifuge a nouveau, 1 min a 8000 rpm et la colonne a 6x6 transferee sur un tube de 2 
ml propre. Ensuite, 500 \xl de tampon AW1 ont 6te ajoutes sur la colonne, puis la 
colonne a ete centrifugee 1 min a 8000 rpm et l'eiuat a 6X6 elimine. 500 fxl de tampon 
AW2 ont et6 ajoutes sur la colonne qui a ensuite ete centrifugee 3 min & 14000 rpm et 

15 transferee sur un tube de 1,5 ml. Enfin, 60 \xl de tampon AVE ont ete ajoutes sur la 
colonne qui a ete incubee 1 & 2 min k temperature ambiante puis centrifugee 1 min a 
8000 rpm. L'eiuat correspondant a 1'ARN purifie a ete recupere et congeie a-20°C. 

2. Amplification, sequencage et clonage des ADNc 
2.1) ADNc codant pour la proline S 

20 Les ARN extraits &. partir du preievement ont ete soumis h une trans- 

cription inverse & Taide d'oligonucieotides hexameriques de sequence aieatoire 
(pdN6), afin de produire des fragments d* ADNc. 

La sequence codant pour la glycoproteine S du SARS-CoV a ete 
amplifiee sous la forme de deux fragments d'ADN chevauchants : fragment 5 ' 

25 (SRAS-Sa, SEQ ID NO:5) et fragment 3'(SRAS-Sb, SEQ ID NO:6), en realisant deux 
amplifications successives a Paide d'amorces imbriquees. Les amplicons ainsi obtenus 
ont ete sequences, clones dans le vecteur plasmidique PCR 2.1-TOPO™ (IN 
VITROGEN), puis la sequence des ADNc clones a ete determine. 
a) clonage et sequenpage des fragments Sa et Sb 

30 aj) synthese de 1] ADNc 

Le melange reactionnel contenant : ARN (5 jal) , H 2 0 ppi (3,5 |Lil), 
tampon de transcriptase inverseSX (4 |il,), dNTP 5 mM (2 |xl), pdN6 100 ug/ml (4 (xl), 
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RNasin 40 UI/ul (0,5 jal) et transcriptase inverse AMV-RT, 10 UI/ul, PROMEGA 
(l)al) a ete incub6 dans un thermocycleur dans les conditions suivantes : 45 min k 
42°C, 15 min k 55°C, 5 min k 95°C, puis l'ADNc obtenu a ete maintenu a +4°C. 
^2) premiere amplified 
5 Les extremites 5 5 et 3' du gene S ont ete amplifiees respectivement 

avec les paires d'amorces S/F1/+/ 21350-21372 et S/Rl/-/ 23518-23498, S/F3/+/ 
23258-23277 et S/R3/-/253 82-253 63. Le melange reactionnel de 50 |xl contenant : 
ADNc (2 nl), amorces 50 jliM (0,5 tampon 10 X (5 jxl), dNTP 5 mM (2 Taq 
Expand High Fidelity, Roche (0,75 yi) et H 2 0 (39, 75 jil) a ete amplify dans un 
10 thermocycleur, dans les conditions suivantes : une 6tape initiale de denaturation a 
94°C pendant 2 min a 6t6 suivie de 40 cycles comprenant : une etape de denaturation a 
94°C pendant 30 sec, vine 6tape d'hybridation a 55°C pendant 30 sec puis une etape 
d'61ongation a 72°C pendant 2 min 30 sec, avec 10 sec d^longation suppl&nentaire k 
chaque cycle, puis d'une etape finale d' elongation a 72°C pendant 5 min. 

1 5 a3) deuxieme .^phficMipn PCR 

Les produits de la premiere amplification PCR (amplicons 5' et 3') 
ont subi une seconde etape d'amplification PCR (PCR nichee) dans des conditions 
identiques a celles de la premiere amplification, avec les paires d' amorces 
S/F2/+/21406-21426 et S/R2/-/23454-23435, et S/F4/+/23322-23341 et S/R4/-/25348- 

20 25329, respectivement pour Tamplicon 5' et l'amplicon 3'. 
a4).clonage.et s^quen^ 

Les amplicons Sa (extremity 5') et Sb (extremity 3') ainsi obtenus ont 
6t6 purifies k Faide du kit QIAquick PCR purification (QIAGEN), en suivant les 
recommandations du fabricant, puis iis ont <§te clones dans le vecteur PCR2.1-TOPO 

25 (kit Invitrogen), pour donner les plasmides denommes SRAS-S1 et SRAS-S2. 

L'ADN des clones Sa et Sb a ete isole puis 1' insert correspondant a 
6t6 sequence a l'aide du Kit Big Dye, Applied Biosystem® et des amorces univer- 
selles M13 forward et M13 reverse, ainsi que des amorces : S/S/+/21867, 
S/S/+/22353, S/S/+/22811, S/S/+/23754, S/S/+/24207, S/S/+/24699, S/S/4-/24348, 

30 S/S/-/24209, S/S/-/23630, S/S/-/23038, S/S/-/22454, S/S/-/21815, S/S/-/24784, 
S/S/+/21556, S/S/+/23130 et S/S/+/24465, en suivant les instructions du fabricant ; les 
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sequences des fragments Sa et Sb ainsi obtenues correspondent aux sequences SEQ ID 
NO :5 et SEQ ID NO :6 dans la liste de sequences jointe en annexe. 

Le plasmide, denomm£ SARS-S1 a ete depose sous le n° 1-3020, le 
12 mai 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 
5 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient un fragment 5* de la 
sequence du g£ne S de la souche de SARS-CoV issue du preldvement repertori6 sous 
le n° 031589, telle que definie ci-dessus, lequel fragment denomme Sa correspondant 
aux nucleotides des positions 21406 a 23454 (SEQ ID NO :5), en reference a la 
sequence Genbank AY274119.3 Tor2. 

10 Le plasmide, d&iomme TOP10F'-SARS-S2 a ete depose sous le n° 

1-3019, le 12 mai 2003, aupr£s de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient un 
fragment 3'de la sequence du gene S de la souche de SARS-CoV issue du preleve- 
ment r6pertori£ sous le n° 031589, telle que definie ci-dessus, lequel fragment 

15 denomme Sb correspondant aux nucleotides des positions 23322 a 25348 (SEQ ID 
NO : 6), en reference k la sequence Genbank n° d'acces AY2741 19.3. 
b) clonage et sgquencage de TADNc complet (clone SRAS-S de 4 kb) 

L'ADNc S complet a ete obtenu a partir des clones SARS-S1 et 
SARS-S2 pr^cites, de la fa9on suivante : 

20 1) une reaction d' amplification PCR a ete realis£e sur un clone 

SARS-S2 en presence de l'amorce S/R4/-/25348-25329 precitee et de 1'amorce 
S/S/+/24696-24715: un amplicon de 633 pb a ete obtenu, 

2) une autre reaction d'amplification PCR a ete realisee sur un autre 
clone SARS-S2, en presence des amorces S/F4/+/23322-23341 precitee et S/S/- 

25 /24803-24784: un amplicon de 1481 pb a ete obtenu, 

La reaction d'amplification a ete realisee dans les conditions telles 
que definies ci-dessus pour F amplification des fragments Sa et Sb, k Pexception que 
30 cycles d' amplifications comprenant une etape de denaturation a 94° C pendant 20 
sec et une etape d' elongation a 72° C pendant 2 min 30 sec ont ete effectues. 

30 3) les 2 amplicons (633 pb et 1481 pb) ont ete purifies dans les 

conditions telles que definies ci-dessus pour les fragments Sa et Sb. 
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4) une autre reaction d' amplification PGR k Paide des amorces 
S/F4/+/23322-23341 et S/R4/-/25348-25329 pr6cit6es, a 6t6 realist sur les amplicons 
purifies obtenus en 3). La reaction d' amplification a 6t€ realisSe dans les conditions 
telles que d^finies ci-dessus pour P amplification des fragments Sa et Sb, k Pexception 
5 que 30 cycles d' amplifications ont 6t6 effectues. 

L'amplicon de 2026 pb ainsi obtenu a ete purifie, clone dans le 
vecteur PCR2.1-TOPO puis s6quenc6 comme ci-dessus, k Paide des amorces telles 
que definies ci-dessus pour les fragments Sa et Sb. Le clone ainsi obtenu a 6t€ 
denomme clone 3'. 

10 5) Le clone SARS-S1 pr^cedemment obtenu et le clone 3 5 ont ete 

dig6res par EcoR I, les bandes d' environ 2kb ainsi obtenues ont ete purifiees sur gel 
puis amplifies par PCR avec les amorces S/F2/+/2 1406-2 1426 et S/R4/-/25348- 
25329 pr6citees. La reaction d'amplification a ete r6alis£e dans les conditions telles 
que definies ci-dessus pour P amplification des fragments Sa et Sb, a Pexception que 

15 30 cycles d' amplifications ont 6t6 effectues. L'amplicon d'environ 4 kb a 6t6 purifie et 
s6quenc6. II a ensuite ete clone dans le vecteur PCR2.1-TOPO pour donner le 
plasrnide, d6nomm6 SARS-S, et Pinsert contenu dans ce plasmide a ete sequence 
comme ci-dessus, k Paide des amorces telles que definies ci-dessus pour les fragments 
Sa et Sb. Les sequences d'ADNc de Pinsert et de Pamplicon codant pour la prot&ne 

20 S, correspondent respectivement aux sequences SEQ ID NO : 4 et SEQ ID NO : 2 
dans la liste de sequences jointe en annexe, elles codent pour la proline S (SEQ ID 
NO : 3). 

La sequence de Pamplicon correspondant a PADNc codant pour la 
proline S de la souche de SARS-CoV issue du prelevement n°031589 prSsente les 
25 deux mutations suivantes par rapport aux sequences correspondantes de respective- 
ment les isolats Tor2 et Urbani, les positions des mutations 6tant indiquSes en r6f6- 
rence a la sequence complete du g&iome de Pisolat Tor2 (Genbank AY2741 19.3) : 

- g/t en position 23220 ; le codon alanine (get) en position 577 de la 
sequence en acides amines de la proteine S de Tor2 est remplac6 par un codon serine 
30 (tct), 

- c/t en position 24872 : cette mutation ne modifie pas la sequence 
en acides amines de la proteine S, et 
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Le plasmide, d&iommS SARS-S, a 6t6 depose sous le n° 1-3059, le 
20 juin 2003, auprds de la Collection Nationale de Cultures de Microorganismes, 25 
rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence d'ADNc codant 
pour la proteine S de la souche de SARS-CoV issue du pr&evement repertorte sous le 

.5 n° 031589, laquelle sequence correspondant aux nucleotides des positions 21406 a 
25348 (SEQ ID NO :4), en reference a la sequence Genbank AY2741 19.3. 
2.2) ADNc codant pour les proteines M et E 

Les ARN issus du pr61£vement 031589, extraits comme ci-dessus, 
ont et£ soumis a une transcription inverse, assoctee, lors de la meme etape (kit Titan 

10 One Step RT-PCR®, Roche), a une reaction ^amplification par PCR, a l'aide des 
couples d' amorces : 

- S/E/F1/+/26051-26070 et S/E/R1/-/26455-26436 pour amplifier l'ORF-E, et 

- S/M/F1/+/26225-26244 et S/M/R1/-/27148-27129 pour amplifier l'ORF-M. 

Un premier melange rSactionnel contenant : 8,6 |il d'H 2 Oppi, 1 (il de 
15 dNTP (5mM), 0,2 jxl de chacune des amorces (50jiM), 1,25 \xl de DTT (lOOmM) et 
0,25 (il de RNAsin (40UI/|il) a et£ combine avec un deuxieme melange reactionnel 
contenant : 1 |al d'ARN, 7 \xl d'H 2 Oppi, 5 ^1 de tampon de RT-PCR 5X et 0,5 \xl de 
melange d'enzyme et les melanges combines ont ete incubes dans un thermocycleur 
dans les conditions suivantes : 30 min k 42°C, 10 min k 55°C, 2 min a 94°C suivi de 
20 40 cycles comprenant une etape de d&iaturation k 94°C pendant 10 sec, une 6tape 
d'hybridation k 55°C pendant 30 sec et une etape d'elongation a 68°C pendant 45 sec, 
avec 3 sec d'increment par cycle et enfin une etape d'elongation terminale a 68°C 
pendant 7 min. 

Les produits d'amplification ainsi obtenus (amplicons M et E) ont 
25 subi une deuxteme amplification PCR (PCR nichee) en utilisant le ldt Expand High- 
Fi®, Roche), k Taide des couples d' amorces : 

- S/E/F2/+/26082-26101 et S/E/R2/-/26413-26394 pour l'amplicon E, et 

- S/M/F2/+/26330-26350 et S/M/R2/-/27098-27078 pour l'amplicon M. 

Le melange reactionnel contenant : 2 jal du produit de la premiere PCR, 39,25 |ul 
30 d'H 2 Oppi, 5 jlxI de tampon 10X contenant du MgCl 2 , 2 jil de dNTP (5mM), 0,5jal de 
chacune des amorces (50 |liM) et 0,75^1 de melange d'enzyme a 6te incube dans un 
thermocycleur dans les conditions suivantes : une etape de denaturation a 94°C 
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pendant 2 min a 6t€ suivie de 30 cycles comprenant une 6tape de d&iaturation a 94°C 
pendant 15 sec, une 6tape d'hybridation a 60°C pendant 30 sec et une etape 
d' elongation k 72° C pendant 45 sec, avec 3 sec d r incr6ment par cycle, et enfin une 
<£tape d'£longation terminale k 72°C pendant 7 min. Les produits d' amplification 
5 obtenus correspondant aux ADNc codant pour les proteines E et M ont 6t6 sequences 
comme ci-dessus, a Paide des amorces: S/E/F2/+/26082 et S/E/R2/-/26394, 
S/M/F2/4-/26330, S/M/R2/-/27078 pn§cit6es et des amorces S/M/+/26636-26655 et 
S/M/-/26567-26548. lis ont ensuite ete clones, comme ci-dessus, pour donner les 
plasmides d&iommes SARS-E et SARS-M. L'ADN de ces clones a ensuite 6t6 isole et 

10 sequence k Paide des amorces universelles M13 forward et M13 reverse ainsi que des 
amorces S/M/4-/26636 et S/M/-/26548 pr^citees. 

La sequence de Pamplicon representant PADNc codant pour la 
proteine E (SEQ ID NO : 13) de la souche de SARS-CoV issue du pr61Svement 
n°031589 ne comporte pas de differences par rapport aux sequences correspondantes 

15 des isolats AY274119.3-Tor2 et AY278741-Urbani. La sequence de la proteine E de 
la souche de SARS-CoV 031589 correspond a la sequence SEQ ID NO : 14 dans la 
liste de sequences jointe en annexe, 

Le plasmide, denomme SARS-E a 6t6 depose sous le n° 1-3046, le 
28 mai 2003, auprds de la Collection Nationale de Cultures de Microorganismes, 25 

20 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence d'ADNc codant 
pour la proline E de la souche de SARS-CoV issue du pr<51evement repertorie sous le 
n° 031589, telle que definie ci-dessus, laquelle sequence correspondant aux 
nucleotides des positions 26082 a 26413 (SEQ ID NO :15), en r6f6rence k la sequence 
Genbank n° d'acces AY2741 19.3. 

25 La sequence de Pamplicon representant PADNc codant pour la M 

(SEQ ID NO :16) de la souche de SARS-CoV issue du prelevement n°031589 ne 
comporte pas de differences par rapport a la sequence correspondante de Pisolat 
AY274119.3-Tor2. En revanche, en position 26857, l'isolat AY278741-Urbani 
comporte un c et la sequence de la souche de SARS-CoV issue du prelevement r6per- 

30 torte sous le n°031589 un t. Cette mutation aboutit a une modification de la sequence 
en acides amines de la proline correspondante: en position 154, une proline 
(AY278741-Urbani) est chang6e en serine dans la souche de SARS-CoV issue du 
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pr£levement r^pertorie sous le n°031589. La sequence de la proteine M de la souche 
de SARS-CoV issue du pr61£vement repertory sous le n°031589 correspond k la 
sequence SEQ ID NO :17 dans la liste de sequences jointe en annexe. 

Le plasmide, denomme SARS-M a ete depose sous le n° 1-3047, le 
5 28 mai 2003, auprds de la Collection Nationale de Cultures de Microorganismes, 25 
rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence d'ADNc codant 
pour la prot£ine M de la souche de SARS-CoV issue du pr&evement repertory sous le 
n° 031589, telle que definie ci-dessus ; laquelle sequence correspondant aux 
nucleotides des positions 26330 a 27098 (SEQ ID NO :18), en reference a la sequence 

10 Genbanlc n° d'acces AY2741 19.3. 

2.3) ADNc correspondant aux ORF3, ORF4, ORF7 a ORF11 

La meme strat£gie d'amplification, de clonage et de sequen9age a ete 
utilis£e pour obtenir les fragments d'ADNc correspondant respectivement aux ORF 
suivantes: ORF 3, ORF4, ORF7, ORF8, ORF9, ORF10 et ORF11. Les couples 

15 d'amorces utilisees pour la premiere amplification sont : 

- ORF3 et ORF4 : S/SE/F1/+/25069-25088 et S/SE/R1/-/26300-26281 

- ORF7&ORF11 : S/MN/F1/+/26898-26917 et S/MN/R1/-/28287-28266 

Les couples d'amorces utilisees pour la deuxieme amplification sont : 

- ORF3 et ORF4 : S/SE/F2/+/25 110-25129 et S/SE/R2/-/26244-26225 
20 - ORF7aORFll : S/MN/F2/+/26977-26996 et S/MN/R2/-/282 18-28 199 

Les conditions de la premiere amplification (RT-PCR) sont les 
suivantes : 45 min a 42°C, 10 min k 55°C, 2 min k 94°C suivi de 40 cycles compre- 
nant une etape de d&iaturation a 94°C pendant 15 sec, une 6tape d' hybridation k 58°C 
pendant 30 sec et une 6tape d'eiongation a 68°C pendant 1 min, avec 5 sec d'incre- 

25 ment par cycle et enfin xme etape d'&ongation terminate a 68°C pendant 7 min. 

Les conditions de la PCR nich£e sont les suivantes : une 6tape de denaturation k 94°C 
pendant 2 min a 6t6 suivie de 40 cycles comprenant une 6tape de denaturation a 94°C 
pendant 20 sec, une etape d'hybridation a 58°C pendant 30 sec et une 6tape 
d'elongation a 72°C pendant 50 sec, avec 4 sec d'incr&nent par cycle et enfin une 

30 etape d' elongation terminale k 72°C pendant 7 min. 

Les produits d'amplification obtenus correspondant aux ADNc 
contenant respectivement les ORF3 et 4 et les ORF7 all ont 6t6 sequences k Paide 
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des amorces : S/SE/+/25363, S/SE/+/25835, S/SE/-/25494, S/SE/-/25875, 
S/MN/+/27839, S/MN/+/27409, S/MN/-/27836 S/MN/-/27799 et clones comme ci- 
dessus pour les autres ORF, pour donner les plasmides denomm^s SARS-SE et 
SARS-MN. L'ADN de ces clones a 6te isole et sequence a Taide de ces memes 
5 amorces et des amorces universelles Ml 3 sens et Ml 3 anti-sens. 

La sequence de l'amplicon representant l'ADNc de la region conte- 
nant les ORF 3 et 4 (SEQ ID NO :7) de la souche de SARS-CoV issue du pr^tevement 
n°031589 comporte une difference nucleotidique par rapport a la sequence corres- 
pondante de l'isolat AY274119-Tor2. Cette mutation en position 25298 aboutit a une 

10 modification de la sequence en acides amines de la proteine correspondante (ORF 3): 
en position 1 1, une arginine (AY2741 19-Tor2) est changge en glycine dans la souche 
de SARS-CoV issue du pretevement n°031589. En revanche, aucune mutation n'a 6t6 
identifiee par rapport a la sequence correspondante de l'isolat AY278741-Urbani. Les 
sequences des ORF 3 et 4 la souche de SARS-CoV issue du pr&evement n°031589 

15 correspondent respectivement aux sequences SEQ ID NO :10 et 12 dans la liste de 
sequences jointe en annexe. 

Le plasmide, denomm6 SARS-SE a 6te depose sous le n° 1-3126, le 
13 novembre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient 

20 l'ADNc correspondant & la region situSe entre l'ORF-S et l'ORF-E et chevauchant 
TORF-E de la souche de SARS-CoV issue du pr^levement repertories sous le n° 
031589, telle que definie ci-dessus, laquelle region correspondant aux nucleotides des 
positions 25110 a 26244 (SEQ ID NO :8), en reference a la sequence Genbank n° 
d'acces AY274119.3, 

25 La sequence de Pamplicon representant l'ADNc correspondant a la 

region contenant les ORF7 a ORF 11 (SEQ ID NO :19) de la souche de SARS-CoV 
issue du pr£levement n°031589 ne comporte pas de differences par rapport aux 
sequences correspondantes des isolats AY274119-Tor2 et AY278741-Urbani. Les 
sequences des ORF7 k 1 1 de la souche de SARS-CoV issue du prelevement n°031589 

30 correspondent respectivement aux sequences SEQ ID NO : 22, 24, 26, 28 et 30 dans la 
liste de sequences jointe en annexe. 
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Le plasmide denomme SARS-MN a 6t6 depose sous le n° 1-3125, le 
13 novembre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la 
sequence d'ADNc correspondant a la region situee entre l'ORF-M et l'ORF-N de la 

5 souche de SARS-CoV issue du prelevement repertorie sous le n° 03 1 589 et prelevee a 
Hanoi, telle que definie ci-dessus, laquelle sequence correspondant aux nucleotides 
des positions 26977 a 28218 (SEQ ID NO :20 ), en reference a la sequence Genbank 
n°d'accesAY274119.3. 

La sequence de l'amplicon repr6sentant l'ADNc correspondant a la 

10 region contenant les ORF7 a ORF11 (SEQ ID NO :19) de la souche de SARS-CoV 
issue du prelevement n°031589 ne comporte pas de differences par rapport aux 
sequences correspondantes des isolats AY274U9-Tor2 et AY27874l-Urbani. Les 
sequences des ORF7 a 11 de la souche de SARS-CoV issue du prelevement n°031589 
correspondent respectivement aux sequences SEQ ID NO : 22, 24, 26, 28 et 30 dans la 

1 5 liste de sequences jointe en annexe. 

2.4) ADNc codant pour la proteine N et incluant les ORF13 et ORF14 

L'ADNc a 6te synthetise et amplifie comme decrit ci-dessus pour les 
fragments Sa et Sb. De maniere plus precise, le melange reactionnel contenant : 5 ul 
d' ARN, 5 ul d'H 2 0 ppi 4 ul de tampon de reverse transcriptase 5X, 2 ul de dNTP (5 

20 mM), 2 jliI d'oligo 20T (5 uM), 0,5 ul de RNasin (40 UI/ul) et 1, 5 ul de AMV-RT (10 
UI/ul Promega) a ete incube dans un thermocycleur dans les conditions suivantes : 45 
min a 42°C, 15 min a 55°C, 5 min a 95°C, puis il a 6t6 maintenu a +4°C 

Une premiere amplification PCR a ete realisee avec la paire 
d'amorces S/N/F3/+/28023 et S/N/R3/-/29480. 

25 Le melange reactionnel comme ci-dessus pour 1' amplification des 

fragments SI et S2 a 6t€ incub6 dans un thermocycleur, dans les conditions suivantes : 
une etape initiate de denaturation a 94°C pendant 2 min a ete suivie de 40 cycles 
comprenant une etape de denaturation a 94°C pendant 20 sec, une etape d'hybridation 
a 55°C pendant 30 sec puis une etape d' elongation a 72°C pendant 1 min 30 sec avec 

30 10 sec d'elongation supplemental a chaque cycle, puis d'une etape finale 
d'61ongation a 72°C pendant 5 min. 
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L'amplicon obtenu k la premiere amplification PCR a subi vine 
seconde etape d' amplification PCR (PCR nichee) avec la paires d'amorce 
S/N/F4/+/28054 et S/N/R4/-/29430 dans des conditions identiques a celles de la 
premiere amplification. 
5 Le produit d' amplification obtenu correspondant k PADNc codant 

pour la proteine N de la souche de SARS-CoV issue du prelevement n°03 1589a 6t6 
sequence k Taide des amorces: S/N/F4/+/28054, S/N/R4/-/29430, S/N/+/28468, 
S/N/+/28918 et S/N/-/28607 et clone comme ci-dessus pour les autres ORF, pour 
dormer le plasmide denommS SARS-N. L'ADN de ces clones a 6t6 isole et sequence k 

10 l'aide des amorces universelles M13 sens et M13 anti-sens, ainsi que des amorces 
S/N/+/28468, S/N/+/28918 et S/N/-/28607. 

La sequence de l'amplicon representant PADNc correspondant a 
l'ORF-N et incluant les ORF13 et ORF14 (SEQ ID NO :36) de la souche de SARS- 
CoV issue du prelevement n°031589 ne comporte pas de differences par rapport aux 

15 sequences correspondantes des isoiats AY274119.3-Tor2 et AY278741-Urbani. La 
sequence de la proteine N de la souche de SARS-CoV issue du prelevement n°031589 
correspond a la sequence SEQ ID NO : 37 dans la liste de sequences jointe en annexe. 

Les sequences des ORF13 et 14 de la souche de SARS-CoV issue du 
prelevement n°031589 correspondent respectivement aux sequences SEQ ID NO : 32 

20 et 34 dans la liste de sequences jointe en annexe. 

Le plasmide denomme SARS-N a &6 depose sous le n° 1-3048, le 5 
juin 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue 
du Docteur Roux, 75724 Paris Cedex 15 ; il contient l'ADNc codant pour la proteine 
N de la souche de SARS-CoV issue du prelevement repertories sous le n° 031589, telle 

25 que definie ci-dessus, laquelle sequence correspondant aux nucleotides des positions 
28054 k 29430 (SEQ ID NO :38), en reference a la sequence Genbank n° d'accfe* 
AY274119.3. 

2.5) extremites 5' et 3' non-codantes 

a) extremite 5'non-codante (5'NC) 
30 ai) sx&Mse de l'ADNc 

Les ARN issus du prelevement 031589, extraits comme ci-dessus, 
ont ete soumis a vine transcription inverse dans les conditions suivantes : 
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L'ARN (15 fil) et l'amorce S/L/-/443 (3 \xl a la concentration de 
5|am, ont ete incubes 1 0 min a 75°C. 

Ensuite, du Tampon de transcriptase inverse 5X (6 \x\, 
INVITROGEN), des dNTP 10 mM (1 \xY) 9 du DTT 0,1M (3 jal) ont ete ajoutes et le 
5 melange a 6t6 incube k 50°C pendant 3 min. 

Enfin la transcriptase inverse (3 \x\ de Superscript®, INVITROGEN) 
a ete ajoutee au melange precedent qui a ete incube k 50°C pendant lh30 puis k 90 °C 
pendant 2 min. 

L'ADNc ainsi obtenu a ete purifie a l'aide du kit QIAquick PCR 

10 purification (QIAGEN), selon les recommandations du fabricant. 
bi) Reaction ^la (TdT) 

L'ADNc (10 jlxI) est incube 2 min k 100°C, conserve dans la glace, 
puis sont ajoutes : H 2 0 (2,5 \xl) 9 tampon TdT 5X (4 AMERSHAM), dATP 5mM 
(2 \xl) et TdT (1,5 pi, AMERSHAM). Le melange ainsi obtenu est incube 45 min k 

15 37°Cpuis2mina65°C. 

Le produit obtenu est amplifie par une premiere reaction PCR a Paide 
des amorces: S/L/-/225-206 et ancre 14T : 5'- 

AGATGAATTCGGTACCTTTTTTTT^^ (SEQ ID NO :68). Les conditions 

de Tamplification sont les suivantes : une etape initiale de denaturation a 94°C 

20 pendant 2 min est suivie de 10 cycles comprenant une etape de denaturation a 94°C 
pendant 10 sec, lane etape d'hybridation a 45°C pendant 30 sec puis une etape 
d'eiongation a 72°C pendant 30 sec puis de 30 cycles comprenant une etape de dena- 
turation a 94°C pendant 10 sec, une etape d'hybridation k 50°C pendant 30 sec puis 
une 6tape d'eiongation k 72°C pendant 30 sec, puis d'une etape finale d'eiongation k 

25 72°C pendant 5 min. 

Le produit de la premiere amplification PCR a subi une seconde 
etape d'amplification k l'aide des amorces : S/L/-/204-185 et ancre 14T precitee dans 
des conditions identiques a celles de la premiere amplification. L'amplicon ainsi 
obtenu a ete purifie, sequence a l'aide de Pamorce S/L/-/182-163 puis il a ete clone 

30 comme ci-dessus pour les differentes ORF, pour dormer le plasmide denomm6 SARS- 
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5'NC. L'ADN de ce clone a 6t6 isolE et sequence a Paide des amorces universelles 
Ml 3 sens et Ml 3 anti-sens et de P amorce S/L/-/182-163 pr£citee. 

L'amplicon representant PADNc correspondant a P extremity 5'NC 
de la souche de SARS-CoV issue du prelevement repertorie sons le n° 031589 
5 correspond a la sequence SEQ ID NO : 72 dans la liste de sequences jointe en annexe ; 
cette sequence ne comporte pas de differences par rapport aux sequences 
correspondantes des isolats AY2741 19.3-Tor2 et AY278741-Urbani. 

Le plasmide d^nomme SARS-5'NC a €t€ depose sous le n° I- 3124, 
le 7 novembre 2003, aupres de la Collection Nationale de Cultures de 

10 Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient 
PADNc correspondant k Pextremite 5'non codante du genome de la souche de SARS- 
CoV issue du prelevement repertorie sous le n° 031589, telle que d^finie ci-dessus, 
laquelle sequence correspondant aux nucleotides des positions 1 k 204 (SEQ ID 
NO :39 ), en reference a la sequence Genbank n° d'acces AY2741 19.3. 

1 5 b) extr&nite 3'non-codante (3 'NC) 
ai) synAj^ede PADNc 

Les ARN issus du prelevement 031589, extraits conune ci-dessus, 
ont 6t6 soumis k une transcription inverse, selon le protocole suivant : le melange 
rSactionnel contenant : ARN (5 \xl), H 2 0 (5 pi), tampon de transcriptase inverse 5X (4 

20 nl), dNTP 5 mM (2 jliI), Oligo 20T 5pM (2 jal), RNasin 40 U/ pi (0,5 pi) et RT-AMV 
10 UI/ jlxI (1,5 pi, PROMEGA) a et6 incube dans un thermocycleur, dans les conditi- 
ons suivantes : 45 min k 42°C, 15 min k 55°C, 5 min k 95°C, puis il a 6t6 maintenu a 
+4°C. 

L'ADNc obtenu a 6t6 amplifie par une premiere reaction PCR a 
25 Paide des amorces S/N/+/28468-28487 et ancre 14T precitee. Les conditions de 
P amplification sont les suivantes : une 6tape initiale de denaturation a 94°C pendant 2 
min est suivie de 10 cycles comprenant une etape de denaturation a 94°C pendant 20 
sec, une etape d'hybridation k 45°C pendant 30 sec puis une etape d'elongation a 
72°C pendant 50 sec puis de 30 cycles comprenant une 6tape de denaturation k 94°C 
30 pendant 20 sec, une etape d'hybridation a 50°C pendant 30 sec puis une etape 
d'£longation a 72°C pendant 50 sec, puis d'une 6tape finale d' Elongation k 72°C 
pendant 5 min. 
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Le produit de la premidre amplification PCR a subi une seconde 
6tape d'amplification k l'aide des amorces S/N/+/28933-28952 et ancre 14T precise, 
dans des conditions identiques a celles de la premiere amplification. L'amplicon ainsi 
obtenu a et<§ purifie, sequence k l'aide de l'amorce S/N/+/29257-29278 et clone 
5 comme ci-dessus pour les diflfcrentes ORF, pour donner le plasmide denomme SARS- 
3'NC. L'ADN de ce clone a 6t6 isol£ et sequence a l'aide des amorces universelles 
M13 sens et M13 anti-sens et de l'amorce S/N/+/29257-29278 precise. 

L'amplicon representant l'ADNc correspondant k l'extremite 3'NC 
de la souche de SARS-CoV issue du prelevement repertorte sous le n° 031589 corres- 
10 pond a la sequence SEQ ID NO :73 dans la liste de sequences jointe en annexe ; cette 
sequence ne comporte pas de differences par rapport aux sequences correspondantes 
des isolats AY2741 19.3-Tor2 et AY278741-Urbani. 

Le plasmide denomm£ SARS-3'NC a 6te depos6 sous le n° 1-3123 le 
7 novembre 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 
15 25 rue du Docteur Roux, 75724 Paris Cedex 15. ; il contient la sequence d'ADNc 
correspondant k l'extremite 3'non codante du genome de la souche de SARS-CoV 
issue du prelevement nSpertoriS sous le n° 03 1 589, telle que definie ci-dessus, laquelle 
sequence correspondant a celle situee entre le nucleotide en position 28933 a 29727 
(SEQ ID NO :40), en reference a la sequence Genbank n° d'acces AY274119.3, se 
20 termine par une serie de nucleotides a. 
2.6) ORFla et ORFlb 

L'amplification de la region 5 f contenant les ORFla et ORFlb du 
g&iome du SARS-CoV issu du prelevement 031589 a 6t6 realist en pratiquant des 
reactions de RT-PCR suivies de PCR nich^es selon les mSmes principes que ceux 
25 pr£c£demment decrits pour les autres ORF. Les fragments amplifies sont chevau- 
chants sur plusieurs dizaines de bases, permettant ainsi la reconstruction informatique 
de la sequence complete de cette partie du genome. En moyenne, les fragments ampli- 
fies sont de deux kilobases. 

14 fragments chevauchants d&iommes L0 a L12 ont ainsi 6t6 
30 amplifies a l'aide des amorces suivantes : 
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Tableau II : Amorces utilises pour Pampliflcation 
de la rffion 5'(ORFla et ORFlb) 



REGION 
AWIPUF1EE 
ET 

SEQUENCEE 
(ne tient pas 
compte des 
amorces) 


Amorce sens 
RT-PCR 


Amorce antisens 
RT-PCR 


Amorce sens 
PCR nichee 


Amorce 
antisens PCR 
nichee 


L0 
50-480 


S/L0/F1/+30 


S/L0/R1/-481 






L1 

231-2240 


S/L1/F1/+147 


S/L1/R1/-2336 


S/L1/F2/+211 


S/L1/R2/-2241 


L2 

2156-4167 


S/L2/F1/+2033 


S/L2/R1/-4192 


S/L2/F2/+2136 


S/L2/R2/-4168 


L3 

3913-5324 


S/L3bis/F1/+3850 


S/L3bis/R1/-5365 


S/L3bis/F2/+3892 


S/L3bis/R2/-5325 


L4b 
4952-6023 


S/L4b/F1/+4878 


S/L4b/R1/-6061 


S/L4b/F2/+4932 


S/L4b/R2/-6024 


L4 

5325-7318 


S/L4/F1/+5272 


S/L4/R1/-7392 


S/L4/F2/+5305 


S/L4/R2/-7323 


L5 

7296-9156 


S/L5/F1/+7111 


S/L5/R1/-9253 


S/L5/F2/+7275 


S/L5/R2/-9157 


L6 

9053-11066 


S/L6/F1/+8975 


S/L6/R1/-11151 


S/L6/F27+9032 


S/L6/R2/-11067 


L7 

10928-12962 


S/L7/F1/+10883 


S/L7/R1/-13050 


S/L7/F2/+ 10928 


S/L7/R2/-12963 


L8 

12835-14834 


S/L8/F1/+12690 


S/L8/R1/-14857 


S/L8/F2/+12815 


S/L8/R2/-14835 


L9 

14765-16624 


S/L9/F1/+14688 


S/L9/R1/-16678 


S/L9/F2/+ 14745 


S/L9/R2/-16625 


L10 
16534-18570 


S/L10/F1/+16451 


S/L10/R1/-18594 


S/L10/F2/+16514 


S/L10/R2/-18571 


L11 
18521-20582 


S/L11/F1/+18441 


S/L11/R1/-20612 


S/L11/F2/+18500 


S/L11/R2/-20583 


L12 
20338-22205. 


S/L12/F1/+20279 


S/L12/R1/-22229 


S/L12/F2/+20319 


S/L12/R2/-22206 



Tous les fragments ont <§te amplifies dans les conditions suivantes, 



excepts le fragment L0 qui a et6 amplify comme d£crit ci-dessus pour l'ORF-M : 
5 - RT-PCR : 30 min a 42°C, 15 min k 55°C, 2 min a 94°C, puis 

T ADNc obtenu est amplifie dans les conditions suivantes : 40 cycles comprenant : une 
£tape de denaturation k 94°C pendant 15 sec, une etape d'hybridation a 58°C pendant 
30 sec puis une 6tape d'61ongation a 68°C pendant 1 min 30 sec, avec 5 sec 
d'elongation suppl&nentaire k chaque cycle, puis une 6tape finale d'&ongation a 68°C 
10 pendant 7 min. 

- PCR nichee : une Stape initiale de denaturation k 94°C pendant 2 
min est suivie de 35 cycles comprenant : une 6tape de denaturation a 94°C pendant 15 
sec, une etape d'hybridation k 60°C pendant 30 sec puis une 6tape d'&ongation k 
72°C pendant 1 min 30 sec, avec 5 sec d'dlongation supptementaire k chaque cycle, 
1 5 puis une etape finale d'Slongation k 72°C pendant 7 min. 
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Les produits d' amplifications ont 6t6 sequences a Taide des amorces 
d^finies dans le Tableau III ci-apres : 

Tableau III : Amorces utilisees pour le sequen^age 
de la region 5' (ORFla et ORFlb) 



Noms 


Sequences (SEQ ID NO : 76 a 139) 


S/L3/+/4932 


5'-CCACACACAGCTTGTGGATA-3' 


S/L4/+/6401 


5'-CCGAAGTTGTAGGCAATGTC-3' 


S/L4/+/6964 


5'-TTTGGTGCTCCTTCTTATTG -3' 


S/L4/-/6817 


5'-CCGGCATCCAAACATAATTT-3' 


S/L5/-/7633 


5'-TGGTCAGTAGGGTTGATTGG-3' 


S/L5/-/8127 


5'-CATCCTTTGTGTCAACATCG-3' 


S/L5/-/8633 


5'-GTCACGAGTGACACCATCCT-3" 


S/L5/+/7839 


5'-ATGCGACGAGTCTGCTTCTA-3' 


S/L5/+/8785 


5'-TTCATAGTGCCTGGCTTACC-3' 


S/L5/+/8255 


5'-ATCTTGGCGCATGTATTGAC-3' 


S/L6/-/9422 


5'-TGCATTAGCAGCAACAACAT-3' 


S/L6/-/9966 


5'-TCTGCAGAACAGCAGAAGTG-3' 


S/L6/-/10542 


5'-CCTGTGCAG I I I GTCTGTCA-3' 


S/L6/+/10677 


5'-CCTTGTGGCAATGAAGTACA-3' 


S/L6/+/10106 


5'-ATGTCAI I I GCACAGCAGAA-3' 


S/L6/+/9571 


5-CTTCAATGG I I I GCCATGTT-3' I 


S/L7/-/11271 


5-TGCGAGCTGTCATGAGAATA-3' 


S/L7/-/11801 


5'-AACCGAGAGCAGTACCACAG-3' 


S/L7/-/12383 


5'-TTTGGCTGCTGTAGTCAATG -3' 


S/L7/+/12640 


5-CTACGACAGATGTCCTGTGC-3' 


S/L7/+/12088 


5'-GAGCAGGCTGTAGCTAATGG-3' 


S/L7/+/11551 


5-TTAGGCTATTGTTGCTGCTG -3' 


S/L8/-13160 


5'-CAGACAACATGAAGCACCAC-3' 


S/L8/-/13704 


5-CGCTGACGTGATATATGTGG-3' 


S/L8/-14284 


5-TGC ACAATG AAGGATACAC C-3' 


S/L8/+/14453 


5'-ACATAGCTCGCGTCTCAGTT-3' 


S/L8/+/13968 


5'-GGCATTGTAGGCGTACTGAC-3' 


S/L8/+/13401 


5'-GTTTGCGGTGTAAGTGCAG-3' 


S/L9/-15098 


5'-TAGTGGCGGCTATTG ACTTC -3' 


S/L9/-15677 


5'-CTAAACCTTGAGCCGCATAG-3' 


S/L9/-16247 


5'-CATGGTCATAGCAGCACTTG-3' 




5 -CCAGGTTGTGATGTCACTGAT-3 


; S/L9/+15858 


5'-CCTTACCCAGATCCATCAAG-3* 


S/L9/+15288 


5'-CGCAAACATAACACTTGCTG-3' 


S/L10/-16914 


5'-AGTGTTGGGTACAAGCCAGT-3' 


S/L10/-17466 


5'-GTTCCAAGGAACATGTCTGG-3' 


S/L10/-18022 


5'-AGGTGCCTGTGTAGGATGAA-3' 


S/L10/+18245 


5'-GGGCTGTCATGCAACTAGAG-3' 


S/L10/+17663 


5'-TCTTACACGCAATCCTGCTT-3' 


S/L10/+17061 


5'-TACCCATCTGCTCGCATAGT-3' 


S/L11/-/18877 


5*-GCAAGCAGAATTAACCCTCA-3' 


S/L11/-19396 


5'-AGCACCACCTAAATTGCATC-3' 


S/L1 1/-20002 


5'-TGGTCCCTTTGAAGGTGTTA-3' 


S/L1 1/+20245 


5'-TCGAACACATCGTTTATGGA-3' 


S/L11/+/19611 


5'-GAAGCACCTGTTTCCATCAT-3' 


S/L11/+/19021 


5'-ACGATGCTCAGCCATGTAGT-3' 


SARS/L1/F3/+800 


5'-GAGGTGCAGTCACTCGCTAT-3' 


SARS/L1/F4/+1391 


5'-CAGAGATTGGACCTGAGCAT-3' 
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SARS/L1/F5/+1925 
SARS/L1/R3/-1674 
SARS/L1/R4/-1107 
SARS/L1/R5/-520 
SARS/L2/F3/+2664 
SARS/L2/F4/+3232 
SARS/L2/F5/+3746 
SARS/L2/R3/-3579 
SARS/L2/R4/-2991 
SARS/L2/R5/-2529 
SARS/L3/F3/+4708 
SARS/L3/F4/+5305 
SARS/L3/F5/+5822 
SARS/L3/R3/-5610 
SARS/L3/R4/-4988 
SARS/L3/R5/-4437 



S'-CAGCAAACCACTCAATTCCT-S' 

5'-AAATGATGGCAACCTCTTCA-3' 

S'-CACGTGGTTGAATGACTTTG-S' 

5'-ATTTCTGCAACCAGCTCAAC -3' 

5'-CGCATTGTCTCCTGGTTTAC -3' 

5'-GAGATTGAGCCAGAACCAGA-3' 

5'-ATGAGCAGGTTGTCATGGAT-3' 

5-CTGCCTTAAGAAGCTGGATG-3' 

5'-TTTCTTCACCAGCATCATCA-3' 

5'-CACCGTTCTTGAGAACAACC-3' 

5'-TCTTTGGCTGGCTCTTACAG -3' 

5'-GCTGGTGATGCTGCTAACTT-3' 

5'-CCATCAAGCCTGTGTCGTAT-3' 

5'-CAGGTGGTGCAGACATCATA-3' 

5'-AACATCAGCACCATCCAAGT-3' 

5-ATCGGACACCATAGTCAACG-3 1 



Les sequences des fragments LO a L12 de la souche de SARS-CoV 
issue du prelevement repertory sous le n° 031589, correspondent respectivement aux 
sequences SEQ ID NO :41 a SEQ ID NO :54 dans la liste de sequences jointe en 
annexe. Parmi ces sequences, seule celle correspondant aux fragments L5 comporte 
une difference nucleotidique par rapport a la sequence correspondante de l'isolat 
AY278741-Urbani. Cette mutation t/c en position 7919 aboutit a une modification de 
la sequence en acides amin6s de la proline correspondante, codee par l'ORF la: en 
position 2552, une valine (codon gtt ; AY278741) est changee en alanine (codon get) 
dans la souche de SARS-CoV 031589. En revanche, aucune mutation n'a 6te identifiee 
par rapport a la sequence correspondante de l'isolat AY274119.3-Urbani. Les autres 
fragments ne presentent pas de differences par rapport aux sequences correspondantes 
des isolats Tor2 et Urbani. 

Exemple 2 : Production et purification de proteines N et S recombinantes de la 
souche de SARS-CoV issue du prel&vement repertory sous Ie numero 031589 

La proteine entidre N et deux fragments polypeptidiques de la 
proteine S de la souche de SARS-CoV issue du prelevement repertorie sous le numero 
031589 ont 6t6 produites chez E. coli, sous forme de protemes de fusion comprenant 
une etiquette polyhistidine N-ou C-terminale. Dans les deux polypeptides S, les 
sequences hydrophobes N et C-terminales de la proteine S (peptide signal : positions 1 
a 13 et h61ice transmembranaire : positions 1196 a 1218) ont ete" del&ees alors que 
l'helice p (positions 565 a 687) et les deux motifs de type coiled-coils (positions 895 a 
980 et 1155 a 1186) de la proteine S ont 6te preserves. Ces deux polypeptides sont 
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constituSs par : un fragment long (S L ) correspondant aux positions 14 a 1193 de la 
sequence en acides amines de la proteine S et un fragment court (Sc) correspondant 
aux positions 475 a 1 193 de la sequence en acides amines de la proteine S. 
1) Clonage des ADNc N, S L et S c dans Ies vecteurs depression pIVEX2.3 et 
5 pIVEX2.4 

Les ADNc correspondant a la proline N et aux fragments Sl et Sc 
ont et£ amplifies par PCR dans des conditions standard, a l'aide de l'ADN polymerase 
Platinium Pfx® (INVITROGEN). Les plasmides SRAS-N et SRAS-S ont ete utilises 
comme matrice et les oligonucleotides suivants comme amorces : 

10 5 '-CCCATATGTCTGATAATGGACCCCAATC AAAC-3 ' (N sens, SEQ ID NO :55) 

5 '-CCCCCGGGTGCCTGAGTTGAATCAGCAG AAGC-3 ' (N antisens, SEQ ID NO :56) 
5 '-CCCATATGAGTGACCTTGACCGGTGCACCAC -3 ' (S c sens, SEQ ID NO :57) 
5^CCCATATGAAACCTTGCACCCCACCTGCTC-3' (S L sens, SEQ ID NO :58) 
5 ' -CCCCCG^GTTTAATATATTGCTC ATATTTTCCC -3 ' (S c et S L antisens, SEQ ID 

15 NO :59). 

Les amorces sens introduisent un site Ndel (souligne) alors que les 
amorces antisens introduisent un site Xmal ou Smal (souligne). Les 3 produits 
d'amplification on ete purifies sur colonne (kit QIAquickPCR Purification, QIAGEN) 
et clones dans un vecteur approprte. L'ADN plasmidique purifie des 3 constructions 

20 (kit QIAFilter Midi Plasmid, QIAGEN) a 6te verifie par sequencage et digere par les 
enzymes Ndel etXmal. Les 3 fragments correspondants aux ADNc N, Sl et Sc ont 6t6 
purifies sur gel d'agarose puis inseres dans les plasmides pIVEX2.3MCS (etiquette 
polyhistidine C-terminale) et pIVEX2.4d (etiquette polyhistidine N-terminale) preala- 
blement digeres par les mSmes enzymes. Apres verification des constructions, les 6 

25 vecteurs d'expressions ainsi obtenus (pIV2.3N, pIV2.3Sc, pIV2.3S L , pIV2.4N, 
pIV2.4S c egalement denomme pIV2.4Si, pIV2.4S L ) ont 6t6 ensuite utilises, d'une part 
pour tester l'expression des proteines in-vitro, et d'autre part pour transformer la 
souche bacterienne BL21(DE3)pDIA17 (NOVAGEN). Ces constructions codent pour 
des proteines dont la masse moleculaire attendue est la suivante : pIV2.3N (47174 

30 Da), pIV2.3S c (82897 Da), prV2.3S L (132056 Da), pIV2.4N (48996 Da), PIV2.4S! 
(81076 Da) et pIV2.4S L (133877 Da). Des bacteries transformees par pIV2.3N ont 6t6 
deposees a la CNCM le 23 octobre 2003, sous le numero 1-3117, et des bacteries 
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transformers par pIV2.4Si ont 6te deposdes k la CNCM le 23 octobre 2003, sous le 
num&ro 1-3118. 

2) Analyse de V expression des proteines recombinantes in-vitro et in vivo 

L 5 expression de prolines recombinantes a partir des 6 vecteurs 
5 recombinants a 6te testee, dans un premier temps, dans un systeme in-vitro (RTS100, 
Roche). Les proteines produites in vitro, apres une incubation des vecteurs recombi- 
nants pIVEX, 4h a 30°C, dans le systeme RTS100, ont 6t6 analyses par western-blot 
k Taide d'un anticorps anti-(his) 6 couple a la p£roxydase. Le resultat d'expression in- 
vitro (Figure 1) montre que seule la proteine N est exprim£e en quantites importantes, 

10 cela quelle que soit la position, N- ou C-terminale, de P<5tiquette polyhistidine. Dans 
une seconde etape, 1' expression des prolines N et S a 6t6 testee in-vivo k 30°C dans 
du milieu LB, en presence ou en l'absence d'inducteur (IPTG ImM). La proline N 
est tr6s bien produite dans ce systeme bacterien (Figure 2) et se retrouve principale- 
ment dans une fraction soluble aprds lyse des bacteries. En revanche, la version longue 

15 de S (S L ) est tres peu produite et completement insoluble (Figure 3). La version courte 
(Sc) pr^sente egalement une trds faible solubility, mais un taux d' expression beaucoup 
plus 61eve que celui de la version longue. Par ailleurs, la construction Sc fusionnee a 
une etiquette polyhistidine en position C-terminale presente une taille plus faible que 
celle attendue. Une experience d' immunodetection avec un anticorps anti-poly- 

20 histidine a montre que cette construction etait incomplete. En conclusion, les deux 
constructions, pIV2.3N et pIV2.4Si, exprimant respectivement la proline N entire 
fusionnee a r etiquette polyhistidine en C-terminal et la proteine S courte fusionnee k 
1* etiquette polyhistidine en N-terminal, ont ete retenues pour produire les deux 
proteines en grande quantity afin de les purifier. Les plasmides pIV2.3N et pIV2.4Si 

25 ont ete deposes respectivement sous le n° 1-3117 et 1-3118 aupres de la CNCM, 25 rue 
du Docteur Roux, 75724 PARIS 15, le 23 octobre 2003. 

3) Analyse de V activity antiglnique des prolines recombinantes 

L'activite antigenique des prot&nes N, Sl et Sc a 6te testee par 
western-blot, k l'aide de deux echantillons de serum, provenant d'un m6me patient 
30 infecte par le SARS-CoV, pr61eves 8 jours (M12) et 29 jours-(M13) apres le debut des 
symptomes du SRAS. Le protocole experimental est comme decrit k l'exemple 3. Les 
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resultats illustnSs par la figure 4 montrent (i) la seroconversion du patient, et (ii) que la 
proline N possede une plus forte reactivate antigenique que la proteine S courte. 
4) Purification de la proteine N a partir de pIV2.3N 

Plusieurs experiences de purification de la proteine N, produite a 
5 partir du vecteur pIV2.3N, ont ete realis£es selon le protocole suivant. Les bacteries 
BL21(DE3)pDIA17, transformees par le vecteur d'expression pIV2.3N, ont ete culti- 
v6es a 30°C dans 1 litre de milieu de culture contenant 0,1 mg/ml d'ampicilline, et 
induites par 1 mM IPTG quand la densite cellulaire, equivalente a A 600 = 0,8, est 
atteinte (environ 3 heures). Apres 2 heures de culture en presence d'inducteur, les 
1 0 cellules ont ete recuperees par centrifugation (10 min a 5000 rpm), remises en suspen- 
sion dans le tampon de lyse (50 mM NaH 2 P0 4 , NaCl 0,3 M, 20 mM imidazole, pH 8 
contenant le melange d'inhibiteurs de proteases Complete® , Roche), et lysees par la 
presse de French (12000 psi). Apres centrifugation du lysat bacterien (15 min a 12000 
rpm), le surnageant (50 ml) a ete depose a un debit de lml/min sur une colonne (15 
15 ml) de chelation metallique (Ni-NTA superflow, Qiagen), equilibree par le tampon de 
lyse. Apr£s lavage de la colonne par 200 ml de tampon de lyse, la proteine N a ete 
eluee par un gradient d'imidazole (20 -»250 mM) en 10 volumes de colonne. Les 
fractions contenant la proteine N ont ete rassembiees et analysees par eiectrophorese 
en gel de polyacrylamide en conditions denaturantes puis coloration au bleu de 
20 Coomassie. Les resultats illustres par la figure 5 montrent que le protocole employe 
permet de purifier la proteine N avec une homogeneite trds satisfaisante (95%) et un 
rendement moyen de 15 mg de proteine par litre de culture. 
5) Purification de la proteine S c a partir de pIV2.4S c (pIV2.4Si) 

Le protocole suivi pour purifier la proteine S courte est tres different 
25 de celui decrit ci-dessus car la proteine est fortement agregee dans le systeme bacte- 
rien (corps d'inclusion). Les bacteries BL21(DE3)pDIA17, transformees par le 
vecteur d'expression pIV2.4Si ont ete cultivees a 30°C dans 1 litre de milieu de 
culture contenant 0,1 mg/ml d'ampicilline, et induites par 1 mM IPTG quand la 
densite cellulaire, equivalente a A 6 oo = 0,8, est atteinte (environ 3 heures). Apres 2 
30 heures de culture en presence d'inducteur, les cellules ont ete recuperees par centrifu- 
gation (10 min a 5000 rpm), remises en suspension dans le tampon de lyse (0,1 M 
Tris-HCl, EDTA 1 mM, pH 7,5), et lysees par la presse de French (1200 psi). Apres 
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centrifixgation du lysat bact&ien (15 min k 12000 rpm), le culot a 6t6 remis en suspen- 
sion dans 25 ml de tampon de lyse contenant 2% Triton XI 00 et 10 mM p- 
mercapto&hanol, puis centrifuge pendant 20 min k 12000 rpm. Le culot a et6 remis en 
suspension dans un tampon Tris-HCl 10 mM contenant 7 M uree, et mis en agitation 
5 douce pendant 30 min k temperature ambiante. Ce dernier lavage des corps 
d'inclusion avec 7 M ur6e est necessaire pour eliminer la plupart des prot&nes 
membranaires d'E. colt qui co-s6dimentent avec la proteine Sc agregee. Apres une 
derniere centrifugation pendant 20 min a 12000 rpm, le culot final est remis en 
suspension dans le tampon Tris-HCl 10 mM. L'analyse 61ectrophor£tique de cette 
10 preparation (Figure 6) montre que la proteine S courte peut etre purifiee avec une 
homog&ieite satisfaisante (environ 90%) a partir des corps d'inclusion (extrait 
insoluble). 

Exemple 3 : Immunodominance de la proteine N 

La reactivite des anticorps presents dans le s6rum des patients 
15 atteints de pneumopathie atypique causae par le coronavirus assocte au SRAS (SARS- 
CoV), vis-^-vis des differentes proteines de ce virus, a et6 analysee par western-blot 
dans les conditions d6crites ci-apres. 
1) Materiel 

a") lvsat de cellules infectfes par le SARS-CoV 
20 Des cellules Vero E6 (2xl0 6 ) ont 6t€ infectives par le SARS-CoV 

(isolat r£pertori6 sous le numero FFM/MA104) a une multiplicity d'infection (M.O.I.) 

de 10 A ou 10" 2 puis incutees dans du milieu DMEM contenant 2% de SVF, k 35°C 

dans une atmosphere contenant 5% de C0 2 . 48 heures plus tard, le tapis cellulaire a 

6t6 lav6 avec du PBS puis lyse avec 500 |al de tampon de depot prepare selon Laemmli 
25 et contenant du B-mercapto&hanoL Les ^chantillons ont ensuite ete bouillis 10 

minutes puis soniqu^s 3 fois 20 secondes. 

b) anticorps 

b i ) s6rum .de patient atteint de pnei^opathie. atypique 

Le serum reference au Centre National de Reference des virus 
30 influenzae (Region-Nord) sous le N° 20033168 est celui d'un patient fran9ais atteint 
d'une pneumopathie atypique causae par le SARS-CoV pr61eve au jour 38 apr6s le 
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debut des sympt6mes ; le diagnostic d'infection par le SARS-CoV a et<§ r6alis<§ par 
RT-PCR nictee et PGR quantitative. 
t>2) s6rams.po^ 
prot&ne S 

5 Les scrums sont ceux produits k partir des prolines recombinantes N 

et S c (exemple 2), selon le protocole d' immunisation decrit k l'exemple 4 ; il s'agit du 
serum du lapin PI 3097 (serum anti-N) et du serum du lapin PI 1 135 (serum anti-S). 
2) MSthode 

20 nl de lysat de cellules infectees par le SARS-CoV k des M.O.I, de 

10 10" 1 et 10' 2 et 5 k titre de controle, 20 \xl d'un lysat de cellules non infectees (mock) ont 
ete separes sur un gel SDS k 10% de polyacrylamide puis transf6r6s sur une 
membrane de nitrocellulose. Apres blocage dans une solution de PBS/lait 5%/Tween 
0,1% et lavage en PBS/Tween 0,1%, cette membrane a ete hybridSe pendant une nuit 
k 4°C avec : (i) l'immun-serum N° 20033168 dilue au 1/300, 1/1000 et 1/3000 dans le 

15 tampon PBS/BSA 1%/Tween 0,1%, (ii) le s<§rum du lapin P13097 (serum anti-N) 
dilue au 1/50000 dans le mSme tampon et (iii) le serum du lapin PI 1 135 (serum anti- 
S) dilu6 au 1/10000 dans le m6me tampon. Aprfcs lavage en PBS/Tween, une hybrida- 
tion secondaire a ete realisee a Paide, soit d'anticorps polyclonaux de mouton dirig6s 
contre les chatnes lourdes et tegeres des immunoglobulines G humaines et couples a la 

20 peroxidase (NA933V, Amersham), soit d'anticorps polyclonaux d'ane diriges contre 
les chaines lourdes et tegeres des immunoglobulines G de lapin et couples a la peroxi- 
dase (NA934V, Amersham). Les anticorps fix6s ont ete reveles a l'aide du kit ECL+ 
(Amersham) et de films d'autoradiographie Hyperfilm MP (Amersham). Une echelle 
de masse moteculaire (kDa) est portee sur la figure. 

25 3) R6sultats 

La figure 7 montre que trois polypeptides de masse mol6culaire appa- 
rente 35, 55 et 200 kDa sont d6tect£s spdcifiquement dans les extraits de cellules 
infectees par le SARS-CoV. 

Afin d'identifier ces polypeptides, deux autres immunoempreintes 
30 (figure 8) ont &6 r6alis6es sur les mdmes echantillons et dans les memes conditions 
avec des anticorps polyclonaux de lapins sp^cifique de la nucl£oprot6ine N (lapin 
P13097, figure 8A) et de la proteine de spicule S (lapin PI 1135, figure 8B) Cette 
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experience montre que le polypeptide de 200 kDa correspond h la glycoprotein de 
spicule S du SARS-CoV, que le polypeptide de 55 kDa correspond a la nucl6oprot&ne 
N tandis que le polypeptide de 35 kDa represente vraisemblablement une forme 
tronqu6e ou d^gradee de la N. 
5 Les donnees presentees dans la figure 7 montrent done que le serum 

20033 168 r^agit fortement avec la N et beaucoup plus faiblement avec la S du SARS- 
CoV, puisque les polypeptides de 35 et 55 kDa sont r€v6l6s sous la forme de bandes 
intenses pour des dilutions de 1/300, 1/1000 et 1/3000 de l'immuns6rum alors que le 
polypeptide de 200 kDa n'est que faiblement r£v61e pour une dilution de 1/300. On 

10 peut noter egalement qu'aucun autre polypeptide du SARS-CoV n'est detecte pour des 
dilutions sup6rieures au 1/300 du serum 20033168. 

Cette experience indique que la reponse en anticorps specifique de 
la N du SARS-CoV domine les reponses en anticorps specifiques des autres poly- 
peptides du SARS-CoV et en particulier la reponse en anticorps dirig6e contre la 

15 glycoprotein S. Elle indique une immunodominance de la nucieoproteine N lors des 
infections humaines par le SARS-CoV. 

Exemple 4 : Preparation d'anticorps polyclonaux monospecifiques diriges contre 
les proteines N et S du coronavirus associS au SRAS (SARS-CoV) 
1) Materiel et methode 

20 Trois lapins (P13097, P13081, P13031) ont ete immunises avec le 

polypeptide recombinant purifie correspondant a T integrality de la nucieoproteine (N), 
prepare selon le protocole decrit a Pexemple 2. Apres une premiere injection de 0,35 
mg par lapin de proline <§mulsionn6e en adjuvant complet de Freund (voie intra- 
dermique), les animaux ont re?us 3 injections de rappel a 3 puis 4 semaines 

25 d'intervalle, de 0,35 mg de proline recombinante emulsionnee en adjuvant incomplet 
de Freund. 

Trois lapins (PI 1135, P13042, P14001) ont 6t6 immunises avec le 
polypeptide recombinant correspondant au fragment court de la proline S (Sc), 
produit comme decrit k l'exemple 2. Comme ce polypeptide est retrouv6 principale- 
30 ment sous la forme de corps d' inclusion dans le cytoplasme bacterien, les animaux ont 
re9us 4 injections intra-dermiques a 3-4 semaines d'intervalle d'une preparation de 
corps d'inclusion correspondant h 0,5 mg de proline recombinante emulsionnee en 
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adjuvant incomplet de Freund. Les 3 premieres injections ont 6t6 rgalisees avec une 
preparation de corps d'inclusion prepares selon le protocole d<§crit k l'exemple 2, 
tandis que la quatri&ne injection a ete realis£e avec une preparation de corps 
d'inclusion qui ont &6 prepares selon le protocole d6crit a l'exemple 2 puis purifies 
5 sur gradient de saccharose et lav6s en 2 % Triton XI 00. 

Pour chaque lapin, un serum pre-immun (p.i.) a et6 pr6par6 avant la 
premiere immunisation et un immun-s£rum (I.S.) 5 semaines apres la quatrieme 
immunisation, 

Dans un premier temps, la r£activit<§ des scrums a ete analyst par 
10 test ELISA vis a vis de preparations de proteines recombinantes semblables k celles 
utilisees pour les immunisations ; les tests ELISA ont ete r£alis£s selon le protocole et 
avec les reactifs tels que ddcrits a l'exemple 6. 

Dans un deuxieme temps, la rSactivite des scrums a ete analysee en 
realisant une immunoempreinte (western blot) d'un lysat de cellules infectees par le 
15 SARS-CoV, en suivant le protocole tel que d6crit k l'exemple 3. 
2) Resultats 

Les tests ELISA (figure 9) ddmontrent que les preparations de 
proline N recombinante et de corps d'inclusion du fragment court de la proteine S 
(S c ) sont immunogSnes chez l'animal et que le titre des serums immuns est Sieve (plus 
20 de 1/25000). 

L'immunoempreinte (figure 8) montre que le serum immun du lapin 
PI 3097 reconnait deux polypeptides presents dans les lysats de cellules infectees par 
le SARS-CoV : un polypeptide dont la masse moteculaire apparente (50-55 kDa selon 
les experiences) est compatible avec celle de la nucleoproteine N (422 residus, masse 

25 moteculaire predite de 46 lcDa) et un polypeptide de 35 kDa, qui repr6sente vraisem- 
blablement une forme tronqu6e ou d£gradee de la N. 

Cette experience montre egalement que le s<Srum du lapin PI 1135 
reconnait principalement un polypeptide dont la masse moteculaire apparente (180- 
220 kDa selon les experiences) est compatible avec une forme glycosytee de la S 

30 (1255 residus, chaJne polypeptidique non glycosytee de 139 kDa), ainsi que des poly- 
peptides plus lagers, qui represented vraisemblablement des formes tronqudes et/ou 
non gly cosy tees de la S. 
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En conclusion, Fensemble de ces experiences d&nontrent que des 
polypeptides recombinants exprimes chez E. coli et correspondant aux proteines N et 
S du SARS-CoV permettent d'induire chez l'animal des anticorps polyclonaux 
capabies de reconnaitre les formes natives de ces proteines. 
5 Exemple 5 : Preparation d'anticorps polyclonaux monospScifiques diriges contre 
les proteines M et E du coronavirus associe au SRAS (SARS-CoV) 
1) Analyse de la structure des proteines M et E 

a) Proteine E 

La structure de la proline E du SARS-CoV (76 acides amines) a ate 
10 analyst in silico , k l'aide de differents logiciels comme signalP vl.l, NetNGlyc 1.0, 
THMM 1.0 et 2.0 (Kxogh et al., 2001, J. Mol. Biol., 305(3):567-580) ou encore 
TOPPRED (von Heijne, 1992, J. Mol. Biol. 225, 487-494). L'analyse montre que ce 
polypeptide non glycosyl6 est une proteine membranaire de type 1, contenant une 
seule h&ice transmembranaire (aa 12-34 d'apres THMM), et dont la plus grande partie 
15 du domaine hydrophile (42 r<Ssidus) est localisee k 1'extremite C-terminale et vraisem- 
blablement a l'interieur de la particule virale (endodomaine). On peut noter une inver- 
sion dans la topologie predite par les versions 1.0 (N-ter est externe) et 2.0 (N-ter est 
interne) du logiciel THMM, mais que d'autres algorithmes, notamment TOPPRED et 
THUMBUP (Zhou et Zhou, 2003, Protein Science 12:1547-1555) confirment une 
20 localisation externe de Pextremite N-terminale de E. 

b) Proteine M 

Une analyse similaire realisee sur la proline M du SARS-CoV (221 
acides amines) montre que ce polypeptide ne poss6de pas de peptide signal (d 5 apres le 
logiciel signalP vl.l) mais trois domaines transmembranaires (residus 15-37, 50-72, 

25 77-99 d'apres THMM2.0) et un grand domaine hydrophile (aa 100-221) localise a 
l'interieur de la particule virale (endodomaine). Elle est vraisemblablement glycosylee 
sur l'asparagine en position 4 (d'apres NetNGlyc 1 .0). 

Ainsi, en accord avec les donnees experimentales connues pour les 
autres coronavirus, il est remarquable que les deux proteines M et E pr^sentent des 

30 endodomaines correspondant k la majeure partie des polypeptides et des ectodomaines 
de trbs petite taille. 
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- Pectodomaine de E correspond vraisemblablement aux rSsidus 1 k 

11 ou 1 k 12 de la proteine : MYSFVSEETGT(L), SEQ ID NO : 70. En effet, la 
probability associee a la localisation transmembranaire du residu 12 est intermediate 
(0,56 d'apres THMM 2.0). 

5 - Pectodomaine de M correspond vraisemblablement aux r^sidus 2 k 

14 de la proteine : ADNGTITVEELKQ, SEQ ID NO : 69. En effet, la methionine N- 
terminale de M est trSs probablement cliv6e du polypeptide mature car le r6sidu en 
position 2 est une Alanine (Varshavsky, 1996, 93:12142-12149). 

Par ailleurs, P analyse de Phydrophobicite (Kyte & Doolittle, Hopp 

10 & Woods) de la proteine E met en Evidence que Pextr&nite C-terminale de 
Pendodomaine de E est hydrophile et done vraisemblablement exposee a la surface de 
ce domaine. Ainsi, un peptide synthetique correspondant a cette extremity est un bon 
candidat immunogene pour induire chez Panimal des anticorps dirig6s contre 
Pendodomaine de E. En consequence, un peptide correspondant aux 24 r6sidus C- 

1 5 terminaux de E a et6 synthetisS. 

2) Preparation d'anticorps diriges contre Pectodomaine des proteines M et E et 
Pendodomaine de la proteine E 

Les peptides M2-14 (ADNGTITVEELKQ, SEQ ID NO : 69), El- 

12 (MYSFVSEETGTL, SEQ ID NO: 70) et E53-76 (KPTVYVYSRV 
20 KNLNSSEGVP DLLV, SEQ ID NO : 71) ont ete synthetases par Neosystem. lis ont 

6t6 couples k la KLH {Keyhole Limpet Hemocyanin) k Paide du MBS (m-maleimido- 
benzoyl-N-hydroxysuccinirnide ester) via une cysteine ajoutee au cours de la synthdse 
soit en N-terminal du peptide (cas de E53-76) soit en C-terminal (cas de M2-14 et El- 
12). 

25 Deux lapins ont ete immunises avec chacun des conjugues, en 

suivant le protocole d' immunisation suivant : apres une premiere injection de 0,5 mg 
de peptide couple k la KLH et &nulsionne en adjuvant complet de Freund (voie intra- 
dermique), les animaux re9oivent 2 & 4 injections de rappel S3 ou 4 semaines 
d'intervalle de 0,25 mg de peptide couple a la KLH et 6mulsionn<S en adjuvant 

30 incomplet de Freund. 
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Pour chaque lapin, un serum pr6-immun (p.L) a ete prepare avant la 
premiere immunisation et un immun-s6rum (LS.) est prepare 3 a 5 semaines apres les 
injections de rappel. 

La r6activit6 des scrums a ete analysee par western blot k l'aide 
5 d'extraits de cellules infectives par le SRAS-CoV (figure 43B) ou k l'aide d' extraits de 
cellules infectees par un virus recombinant de la vaccine exprimant la proteine E (W- 
TG-E, figure 43 A) ou M (VV-TN-M, figure 43C) de l'isolat 031589 du SRAS-CoV. 

Les immuns^rums des lapins 22234 et 22240, immunises par le 
conjugue KLH-E53-76, reconnaissent un polypeptide d'environ 9 a lOkD, qui est 

10 present dans les extraits de cellules infectees par le SRAS-CoV mais absent dans les 
extraits de cellules non infectees (figure 43B). La masse apparente de ce polypeptide 
est compatible avec la masse predite de la proline E, qui est de 8,4 kD. De fa9on 
similaire, Timmunserum du lapin 20047, immunise par le conjugue KLH-E1-12, 
reconnait un polypeptide present dans les extraits de cellules infectees par le virus 

15 VV-TG-E, dont la masse molaire apparente est compatible avec celle de la proteine E 
(figure 43A). 

L'immunserum des lapin 20013 et 20080, immunises par le 
conjugu6 KLH-M2-14, reconnait un polypeptide present dans les extraits de cellules 
infectees par le virus VV-TN-M (figure 43 C), dont la masse molaire apparente (18 kD 
20 environ) est compatible avec celle de la glycoprotein M, qui est de 25,1 kD et 
presente un point iso£lectrique 61ev6 (9.1 pour le polypeptide nu). 

Ces r6sultats demontrent que les peptides El -12 et E53-76 d'une 
part et le peptide M2-14 d'autre part permettent d'induire chez l'animal des anticorps 
polyclonaux capables de reconnaitre les formes natives des prolines E et M 
25 respectivement du SRAS-CoV. 

Exemnle 6 : Analyse de la reactivite en ELISA de la proteine N recombinante, 
vis-a-vis de serums de patients atteints de SRAS 

1) Materiel 

L'antigene utilise pour preparer les phases solides est la nucteo- 
30 proteine N recombinante puriflSe prepare selon le protocole decrit a Texemple 2. 
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Les strums k tester (Tableau IV) ont ttt choisis sur la base des 
rtsultats d' analyse de leur rtactivitt par immunofluorescence (titre IF-SRAS), vis-&- 
vis de cellules infecttes par le SARS-CoV. 

Tableau IV ; Serums testes en ELISA 



Reference 


N° serum 


Type 
de serum 


Date du 
Serum*** 


Titre IF-SRAS 


3050 


A 


T6moin 


na* 


nt** 


3048 


B 


Temoin 


na 


nt 


033168 


D 


Patient 1-SRAS 


27/04/03 (J38) 


320 


033397 


E 


Patient-1 SRAS 


11/05/03 (J52) 


320 


032632 


F 


Patient-2 SRAS 


21/03/03 (J17) 


2500 


032791 


G 


Patient-3 SRAS 


04/04/03 (J3) 


<40 


033258 


H 


Patient-3 SRAS 


28/04/03 (J27) 


160 



*na : non-applicable. ** nt : non-teste. *** les dates indiquees correspondent au n ombre de 
jours apres le d6but des symptdmes de SRAS. 

2) Methode 

10 La proteine N (100 fxl) dilute k differentes concentrations dans du 

tampon carbonate 0,1 M, pH 9,6 (1, 2 ou 4 \xg/ml) est distribute dans les puits de 
plaques ELISA, puis les plaques sont incubees une nuit k temperature du laboratoire. 
Les plaques sont lavees avec du tampon PBS-Tween, saturtes avec du tampon PBS- 
lait ecrtmt-saccharose (5 %). Les strums k tester (100 pY) prealablement diluts (1/50, 

15 1/100, 1/200, 1/400, 1/800, 1/1600 et 1/3200) sont ajoutes, puis les plaques sont incu- 
bees 1 h a 37° C. Apres 3 lavages, le conjugue anti-IgG humaines marque a la peroxy- 
dase (reference 209-035-098, JACKSON) dilue au 1/18000 est ajoutt puis les plaques 
sont incubtes lh k 37 °C. Aprts 4 lavages, le chromogene (TMB) et le substrat (H 2 0 2 ) 
sont ajoutes et les plaques sont incubees 30min k temperature ambiante, a Pabri de la 

20 lumitre. La reaction est ensuite arrette puis Pabsorbance k 450 nm est mesurte a 
Paide d'un lecteur automatique. 

3) Rtsultats 

Les tests ELISA (figure 10) dtmontrent que la preparation de 
proteine N recombinante est reconnue specifiquement par les anticorps de strums de 
25 patients atteints de SRAS prtleves en phase tardive de P infection (> 17 jours apres le 
debut des symptomes) alors qu'elle n'est pas reconnue de fa9on significative par les 
anticorps d'un strum de patient prtlevt en phase prtcoce de Pinfection (3 jours aprts 
le dtbut des symptdmes) ni par des strums ttmoins de sujets non atteints de SRAS. 
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Exemple 7 : Tests ELISA elabores pour une detection tres specifique et sensible 
(Tune infection par le coronavirus associe au SRAS, a partir de s6rums de 
patients 

1) Test ELISA IgG indirect 

5 

a) R6actifs 

Preparation des plaques 

10 Les plaques sont sensibilis6es par une solution de proline N k 

2jxg/mL dans un tampon PBS lOmM pH 7,2, rouge de phenol k 0,25mL /L. 100 jjL de 
solution sont d6pos£s dans les puits et laiss6s incubus a temperature ambiante pendant 
une nuit La saturation se fait par un prelavage en tampon PBS lOmM / tween 0,1%, 
suivi d f un lavage avec une solution de saturation PBS, 25% lait /saccharose. 

1 5 Diluant serums 

Tampon TRIS 0,48g/L, PBS lOmM, EDTA 3,7g/L,lait 15% v/v , pH 

6,7 

Diluant conjugue 

Tampon citrate (15g/L), tween 0,5% , serum bovin 25%, NaCl 12%, 
20 lait ecreme 6% v/v PH 6,5 
Conjugue 

Conjugue anti-IgG humaines 50X, commercialises par Bio-Rad : kit 
Platelia H. pylori ref 72778 
Autres solutions : 

25 Solution de lavage R2, Solutions de relation au TMB R8 diluant, 

R9 chromog6ne, R10 solution d'arret : reactifs commercialisms commercialisees par 
Bio-Rad (ex : kit Platelia pylori, ref 72778) 

b) Mode operatoire 

Diluer les serums au 1/200 dans le diluant Schantillons 
30 Distribuer 100^L/puits 

Incubation lh a 37°C 

3 lavages en solution de LAVAGE R2 lOx pr^alablement diluee 10 
fois en eau d^mineralisee (le., solution de lavage IX) 



WO 2005/056584 



PCTVFR2004/003106 



76 

Distribuer IOOjliL de conjuguS (conjugue 50x k diluer 
extemporan6ment dans le diluant conjugue fourni) 

Incubation lha37°C 

4 lavages en solution de lavage IX 
5 distribuer 200p.L/puits de solution de revelation (k diluer 

extemporan&nent ex:l mL de R9 dans lOmL de R8) 

Incubation 30 min k temperature ambiante a l'obscurite 

arreter la reaction avec 100|aL/puits de RIO 

LECTURE k 450/620nm 
10 Les r£sultats peuvent 6tre interpr&es en prenant un serum SEUIL 

donnant une reponse au dela de laquelle les serums testes seront considers comme 
positifs. Ce s6rum est choisi et dilue de fa<?on k donner un signal significativement 
sup&rieur au bruit de fond. 
2) Test ELISA DOUBLE EPITOPE 

15 

a) Reactifs 

Preparation des plagues 

20 Les plaques sont sensibilisees par une solution de proteine N a 

ljig/mL dans un tampon PBS lOmM pH 7,2, rouge de phenol k 0,25mL /L. 100 |iL de 
solution sont d6pos6s dans les puits et laisses incubes a temperature ambiante pendant 
une nuit La saturation se fait par un pr&avage en tampon PBS lOmM / 0,1% tween 
suivi d'un lavage avec une solution de saturation PBS lOmM, lait 25% (V/V) 

25 Diluant serums et conjugue 

Tampon TRIS saline 50mM pH8, lait 2% 

Conjugue 

II s'agit de la proline N recombinante purifiee, couplee k la 
peroxidase selon le protocole de Nakane (Nakane P.K* and Kawaoi A; (1974) : 
30 Peroxydase-labeled antibody, a new method of conjugation. The Journal of 
Histochemistry and Cytochemistry Vol22 3 N)23, pp 1084-1091.), dans des ratios 
molaires respectifs 1/2. Ce conjuguS ProtN POD est utilise a une concentration de 
2jxg/mL dans du diluant serum/conjugu6. 
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Autres solutions : 

Solution de lavage R2, Solutions de relation au TMB R8, diluant , 
R9 chromogdne, RIO solution d'arrSt : reactifs commercialisms par Bio-Rad (ex kit 
platelia pylori ref 72778). 

5 

b) Mode operatoire 

lere etape en plaque de "predilution" 

■ Diluer chaque serum au 1/5 dans la plaque de predilution (48 |xL de diluant +12 
10 de s6rum). 

■ Apres avoir dilues l'ensemble des serums, distribuer 60(iL de conjugu<§ 

■ Le cas 6ch6ant, le melange s6rum + conjugu6 est laissS k incuber. 

2eme etape en plaque de "reaction 1 ' 
1 5 ■ Transferer 100|aLde melange/puits dans la plaque de r6action 
Incubation lh 37°C 

■ 5 lavages en solution de LAVAGE R2 lOx pr6alablement diluee 10 fois en eau 
demineralisee (--> solution de lavage lx) 

■ distribuer 200|aL/puits de solution de revelation (a diluer extemporanement ex:l 
20 mL de R9 dans lOmL de R8) 

■ incubation 30min a temperature ambiante a l'abri de la lumiere 

■ arreter la reaction avec 1 00|uL/puits de Rl 0 

■ LECTURE k 450/620nm 

De meme que pour le test ELISA indirect, les resultats peuvent etre 
25 interprets en utilisant un serum "valeur seuil". Tout serum ayant une rgponse 
superieure au s6rum valeur seuil sera consid&6 comme positif. 
2) Resultats 

Les scrums de patients classes comme cas probables de SRAS de 
l'hdpital fran?ais de Hanoi, Vietnam ou en relation avec Thopital fran9ais de Hanoi 
30 (JYK) ont 6te analyses en utilisant le test IgG-N indirect et le test N double Epitope. 

Les resultats du test IgG-N indirect (figures 14 et 15) et N double 
epitope (figures 16 et 17) montrent une excellente correlation entre eux ainsi qu'avec 
un test ELISA indirect comparant la r^activite des scrums vis-^-vis d'un lysat de 
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cellules VeroE6 non infectives ou infectees par le SRAS-CoV (ELISA-iysat SRAS- 
CoV ; voir le Tableau V ci-apres). Tous les scrums pr61ev6s 12 jours ou plus apres le 
debut des symptomes ont 6t6 trouves positifs, y compris chez des patients pour 
lesquels l'infection par le virus du SRAS-CoV n'avait pas pu etre documents par 
5 analyse de pr£levements respiratoires par RT-PCR, vraisemblablement en raison d'un 
prelevement trop tardif au cours de l'infection (> J12). Dans le cas du patient TTH 
pour lequel un pr61evement nasal realist a J7 a 6t6 trouve negatif par RT-PCR, la 
quality du prelevement pourrait etre en cause. 

Certains scrums ont 6te trouv^s n^gatifs alors que la presence de 

10 SRAS-CoV a 6t6 detects par RT-PCR. II s'agit dans tous les cas de serums pr6coces 
prelev6s moins de 10 jours apr£s le debut des symptomes (ex : serum # 032637). Dans 
le cas d'un patient PTTH (s6rum # 032673), seule une suspicion de SRAS etait 
evoqu6e au moment ou les pr&evements ont et6 realises. 

En conclusion, les tests serologiques IgG-N indirect et N-double 

15 epitope permettent de documenter P infection par le SRAS-CoV chez tous les patients 
pour des serums prelevSs 12 jours ou plus apres l'infection. 



Tableau V : Resultats des tests ELISA 



Num Pvt 


Patient 


Jour 


PCR-SARS 
(D 


ELISA 
lysat 
SRAS- 
CoV (2) 


IgG-N 
(2 6me serfe) 


2Xepitope 
(2 4m9 serie) 


033168 


JYK 


38 


POS 


+++ 


>5000 


NT 


033597 


L JYK 


74 


POS 


NT 


*5000 


NT 


032552 


VTT 


8 


NEG- 
J3&J8&J12 


NEG 


<200 


<5 


032544 


CTP 


16 


NEG 
J16&J20 


++ 


>5000 


»20 


032546 


CJF 


15 


NEG 
J15&J19 


++ 


>5000 


»20 


032548 


PTL 


17 


NEG 
J17&J21 


++ 


>5000 


»20 


032550 


NTH 


17 


NEG-J17&J21 


++ 


>5000 


»20 


032553 


VTT 


8 


NEG- 

J3&J8&J12 


NEG 


<200 


<5 


032554 


NTBV 


4 


POS 


NEG 


<200 


<5 


032555 


NTBV 


4 


POS 


NEG 


<200 




032564 


NTP 


15 


POS 


++ 


>5000 


»20 


032629 


NVH 


4 


POS 


NEG 


<200 


<5 


032631 


BTTX 


9 


POS 


NEG 


<200 


<5 


032635 


NHH 


4 


POS 


NEG 


<200 


<5 


032637 


NHB 


10 


POS 


NEG 


<200 


<5 


032642 


BTTX 


9 


POS 


NEG 


<200 


<5 
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032643 


LTDH 


1 


POS 


NEG 


<200 


<5 


032644 


NTBV 


4 


POS 


IN CO 




<5 


032646 


TTH 


12 


NEG 

J7&J12&J16 


++ 


>5000 


»20 


032647 


DTH 


17 


NEG 
J17&J21 


++ 




»20 


032648 


NNT 


15 


NEG 
J15&J19 


i, ■■ 

T "1 




»20 


032649 


PTH 


17 


NEG 
J17&J21 


i i_ 




»20 




1 W 

L_ V V 


16 


NEG 
J16&J20 


+ 


>5000 


»20 


032673 


PTTH 


NA 


NEG 


NEG 


<200 


<5 


032674 


PNB 


17 


NEG 
J17&J21 


++ 


>6000 


»20 


032682 


VTH 


12 


NEG 
J12&J16 


++ 


>5000 


»20 


032683 


DTV 


17 


NEG 
J17&J21 


+ 


>1000 


»20 



Notes: 



(1) : Les analyses par RT-PCR ont ete realisees par RT-PCR nichee BNI, LC Artus et 
LC-N sur des ecouvillonnages nasaux ou pharyng<£s; POS signifie qu'au moins un 
prelevement a ete trouve positif chez ce patient. 
5 (2) : La reactivite des serums dans le test ELISA utilisant un lysat de cellules infectees 
par le SRAS-CoV a ete classee en tres fortement reactif (+++), fortement reactif (++), 
reactif (+) et negatif en fonction de la valeur DO obtenue aux dilutions testees 
Exemple 8 : Detection du coronavirus associe au SRAS (SARS-CoV) par RT- 
PCR 

10 1) Mise au point de conditions de RT-PCR en temps reel a l'aide d'amorces 
specifiques du gene de la proteine de nucleocapside - test "Light Cycler N" 

a) conception des amorces et des sondes 

La conception des amorces et sondes a 6t6 realisee a partir de la 
sequence du genome de la souche de S ARS-CoV issue du prelevement repertorie sous 
15 le numero 031589, a l'aide du programme "Light Cycler Probe Design (Roche)". 
Ainsi les deux series d'amorces et de sondes suivantes ont ete selectionnees : 

- serie 1 (SEQ ID NO : 60, 61, 64, 65): 

- amorce sens : N/+/28507 : 5'-GGC ATC GTA TGG GTT G-3' [28507-28522] 

- amorce antisens : N/-/28774 : 5'-CAG TTT CAC CAC CTC C-3' [28774-28759] 

20 - sonde 1 : 5'-GGC ACC CGC AAT CCT AAT AAC AAT GC-fluoresceine 3' [28561- 
28586] 
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- sonde 2 : 5' Red705 -GCC ACC GTG CTA CAA CTT CCT-phosphate [28588-28608] 

- serie 2 (SEQ ID NO : 62, 63, 66, 67) 

- amorce sens : N/+/28375 : 5 3 -GGC TAC TAC CGA AGA G-3' [28375-28390] 

- amorce antisens : N/-/28702 : 5'-AAT TAC CGC GAC TAC G-3' [28702-28687] 

5 - sonde 1 : SRAS/N/FL : 5'-ATA CAC CCA AAG ACC ACA TTG GC - fluoresceine V 
[28541-28563] 

- sonde 2 : SRAS/N/LC705 : 5' Red705 -CCC GCA ATC CTA ATA ACA ATG CTG C- 
phosphate3' [28565-28589] 

10 b) analyse de Pefficacite des deux couples amorces 

Afin de tester Tefficacite respective des deux couples d f amorces, une 
amplification par RT-PCR a 6te realis^e sur un ARN synthetique correspondant aux 
nucleotides 28054-29430 du genome de la souche de SARS-CoV issue du preleve- 
ment repertorte sous le num6ro 03 1589et contenant la sequence du gene N. 

1 5 De maniere plus precise : 

Cet ARN synthetique a ete prepare par transcription in vitro a l'aide 
de TARN polymerase du phage T7, d'une matrice d'ADN obtenu par linearisation du 
plasmide SRAS-N avec Tenzyme Bam HI. Aprds elimination de la matrice d'ADN par 
digestion a l'aide de DNAse 1, les ARN synthetiques sont purifies par une extraction 

20 au phenol-chloroforme suivie de deux precipitations successives en acetate 
d'ammonium et isopropanol. lis sont alors quantifies par mesure de Tabsorbance & 260 
run et leur qualite est controlee par le rapport des absorbances a 260 et 280 nm ainsi 
que par une eiectrophorese en gel d f agarose. Ainsi, la concentration de la preparation 
d ! ARN synth6tique utilisee pour ces etudes est de 1,6 mg/ml, ce qui correspond a 

25 2,1. 10 15 copies/ml d r ARN. 

Des quantites decroissantes d f ARN synthetique ont ete amplifies par 
RT-PCR a Taide du icit "Superscript™ One-Step RT-PCR with Platinum® Taq" et les 
couples dWorces n° 1 (N/+/28507, NA/28774) (figure 1A) et n° 2 (N/+/28375, NA 
/28702) (figure IB), en suivant les indications du fournisseur. Les conditions d'ampli- 
30 fication utilisees sont les suivantes : TADNc a ete synthetise par incubation 30 min a 
45 °C, 15 min a 55°C puis 2 min a 94 °C puis il a ete amplifie par 5 cycles compre- 
nant : une etape de denaturation a 94°C pendant 15 sec, une etape d'hybridation k 
45°C pendant 30 sec puis une etape d'eiongation a 72°C pendant 30 sec, suivis de 35 
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cycles comprenant : une etape de d&iaturation a 94°C pendant 15 sec, une etape 
d'hybridation a 55°C pendant 30 sec puis une etape d' Elongation k 72°C pendant 30 
sec, avec 2 sec d'elongation suppldmentaire a chaque cycle, et d'une Etape finale 
d'Elongation a 72°C pendant 5 min. Les produits d'amplification obtenus ont ensuite 
5 6t6 maintenus k 1 0°C. 

Les resultats presentes a la figure 11 montrent que le couple 
d'amorces n° 2 (N/+/28375, N/-/28702) permet de d&ecter jusqu'a 10 copies d'ARN 
(bande de faible intensite) ou 10 2 copies (bande de bonne intensite) contre 10 4 copies 
pour le couple d ! amorces n° 1 (N/+/28507, N/-/28774). Les amplicons sont respecti- 
10 vement de 268 pb (couple 1) et de 328 pb (couple 2). 

c) mise au point de la RT-PCR en temps reel 

Une RT-PCR en temps rEel a ete mise au point a 1'aide du couple 
d'amorces n°2 et du couple de sonde constitue par SRAS/N/FL et SRAS/N/LC705 
(figure 2). 

15 ^amplification a 6t6 rEalisEe sur un LightCycler™ (Roche) a Taide 

du kit "Light Cycler RNA Amplification Kit Hybridization Probes " (reference 2 015 
145, Roche) dans les conditions optimisees suivantes. Un Melange reactionnel conte- 
nant : H 2 0 (6,8 |il), MgCl 2 25 mM (0,8 4 \xM final de Mg2+), melange reactionnel 
5X (4 ^il), sonde SRAS/N/FL 3jxM (0,5 0,075 jxM final), sonde SRAS/N/LC705 3 

20 \iM (0,5 |il, 0,075 [iM final), amorce N/+/28375 10 |iM (1 \xl 9 0,5 \xM final), amorce 
N/-/28702 10 \xM (1 juil, 0,5 final), melange d'enzyme (0,4 ^1) et 6chantillon 
(ARN viral, 5 |al) a 6t6 amplify en suivant le programme suivant : 

- Transcription inverse : 50°C 10:00min analysis mode: none 

- Denaturation : 95°C 30sec xl analysis mode: none 
25 - Amplification : 95°C 2sec > 

50°C 15sec analysis mode: quantification *} x45 

72°C 13sec rampe thermique 2,0°C/sec > 

- refroidissement : 40°C 30sec xl analysis mode: none 

*La mesure de fluorescence se fait a la fin de Phybridation et a chaque cycle (en mode 
30 SINGLE). 
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Les resultats presentes a la figure 12 montrent que cette RT-PCR en 
temps reel est tres sensible puisqu'elle permet de detecter 10 2 copies d'ARN 
synthetique dans 100% des 5 echantillons analyses (29/29 echantillons dans 8 expe- 
riences) et jusqu'a 10 copies d'ARN dans 100% des 5 echantillons analyses (40/45 
5 echantillons dans 8 experiences). Elle montre egalement que cette RT-PCR permet de 
detecter la presence du genome du SARS-CoV dans un echantillon et de quantifier le 
nombre de genomes presents. A titre d'exemple, TARN viral d'un stock de SARS- 
CoV cultive sur cellules Vero E6 a ete extrait a l'aide du kit "Qiamp viral RNA 
extraction" (Qiagen), dilue a 0,05. 10" 4 et analyse par RT-PCR en temps reel selon le 
10 protocole decrit ci-dessus; l'analyse presentee a la figure 12 montre que ce stock de 
virus contient 6,5. 10 9 genomes -equivalents/ml (geq/ml), ce qui est tout a fait 
similaire a la valeur de 1,0.10 10 geq/ml mesuree a l'aide du kit "RealArt™ HPA- 
Coronavirus LC RT PCR Reagents" commercialise par Artus. 

2) Mise au point de conditions de RT-PCR nichee ciblant le gene de TARN 
15 polymerase - test "RT-PCR nichee CDC (Centers for Disease Control and 
Prevention) /IP" 

a") Extraction de l'ARN viral 

20 Echantillon clinique : QIAamp viral RNA Mini Kit (QIAGEN) selon les indications 
du fabricant, ou une technique equivalente. L'ARN est elue dans un volume de 60 ul. 
h) RT-PCR nichee "SNE/SAR" 

Premiere itape : RT-PCR couplie « SNE » 

25 

Le kit Invitrogen "Superscript™ One-Step RT-PCR with Platinum® 

Tag"a ete utilise, mais le kit "Titan" de Roche Boehringer peut lui etre substitue avec 

des resultats similaires. 

Oligonucleotides : 
30 -SNE-S1 5' GGT TGG GAT TAT CCA AAA TGT GA 3 ' 

- SNE-AS 1 5'GCA TCA TCA GAA AGA ATC ATC ATG 3' 

-> Taille attendue :440 pb 

1. Preparer un mix : 

H20 6,5 ul 
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Reaction mix 2X 12,5 ul 

Oligo SNE-S1 50 uM 0,2 pi 

Oligo SNE-AS1 50 uM 0,2 ul 
RNAsin 40 U/ul 0,12 ul 

5 RT/Platinum Taq mix 0, 5 ul 

2. A 20 ul du mix, ajouter 5 ul d'ARN et proc6der a l'amplification sur 
thermocycleur (conditions ABI 9600) : 
2.1 45°C 30min. 
55°C 15min. 



10 94°C 2min. 

2.2. 94°C 15 sec. } 

45°C 30 sec. } x 5 cycles 

72°C 30 sec. } 

2.3. 94°C 15 sec. } 

15 55°C 30 sec. }x 35 cycles 



72°C 30 sec. + 2sec./cycle } 
2.4. 72°C 5min. 
2.5 10°C oo 
Conservation a +4°C. 

20 La RNAsin (N2511/N2515) de Promega a et6 utilisee comme 

inhibiteurs de RNase. 

Des ARN synthetiques ont servi de temoin positif. A titre de 
controle, 10 3 , 10 2 et 10 copies d'ARN synthetique Rsne ont ete amplifiees dans chaque 
experience. 
25 Seconde itape : PCR nichee "SAR" 
Oligonucleotides : 

- SAR1-S 5' CCT CTC TTG TTC TTG CTC GCA 3' 

- SAR1-AS 5' TAT AGT GAG CCG CCA CAC ATG 3' 
-> Taille attendue : 121 pb 

30 1. Preparer un mix : 

H20 35,8 ul 

Tampon Taq 1 OX 5 ul 
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MgCl 2 25 mM 4 ul 

Mix dNTPs 5 mM 2 ul 

Oligo SAR1-S 50 uM 0,5 ul 

Oligo SAR1-AS 50 uM 0,5 ul 
5 Taq ADN pol 5 U/\xl 0,25 ul 

L'AmpliTaq DNA Pol d' Applied Biosystems a et6 utilisee (tampon 
10X sans MgCl 2 , ref 27216601). 

2. A 48 ul du mix, ajouter 2 p.1 du produit de la premiere PCR et proceder a 
l'amplification (conditions ABI 9600) : 



10 2.1. 94°C 2min. 

2.2. 94°C 30 sec. } 

45°C 45 sec. } x 5 cycles 

72°C 30 sec. } 

2.3. 94°C 30 sec. } 

15 55°C 30 sec. }x 35 cycles 



72°C 30 sec. + lsec/cycle } 
2.4. 72°C 5 min. 
2.5 10°C °o 

3. Analyser 10 ul du produit reactionnel sur gel "low-melting" (type Seakem GTG) a 
20 3% d'agarose. 

La sensibility du test niche est en routine, dans les conditions 
decrites, de 10 copies d'ARN. 

4. Les fragments peuvent ensuite etre purifies sur QIAquick PCR kit (QIAGEN) et 
sequences avec les oligos SAR1-S et SARI -AS. 

25 3) Detection de TARN du SARS-CoV par PCR a partir de prelevements 
respiratoires 

a) Premiere 6tude comparative 

Une etude comparative a et6 realisee sur une serie de prelevements 
respiratoires re9us par le Centre National de Reference du Virus Influenzae (region 
30 nord) et susceptibles de contenir du SARS-CoV. Pour ce faire, l'ARN a ete extrait des 
prelevements a l'aide du kit "Qiamp viral RNA extraction" (Qiagen) et analyse par 
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RT-PCR en temps r6el, d'une part k l'aide des couples d f amorces et de sondes de la 
s6rie n° 2 dans les conditions decrites ci-dessus d'une part, et d' autre part k l'aide du 
kit "LightCycler SARS-CoV quantification kit" commercialism par Roche (reference 
03 604 438). Les resuitats sont resumes dans le Tableau VI ci-dessous. lis montrent 
5 que 18 des 26 prelevements sont n^gatifs et 5 des 26 prelevements sont positifs pour 
les deux kits, tandis qu'un pr£16vement est positif pour le seul kit Roche et deux pour 
les seuls rSactifs N "serie2". En outre, pour 3 prelevements (20032701, 20032712, 
20032714) les quantity d'ARN d&ectes sont nettement sup6rieures avec les r6actifs 
(sondes et amorces) de la serie n°2. Ces resuitats indiquent que les amorces et sondes 
10 N n s£rie2 ,! sont plus sensibles pour la detection du genome du SARS-CoV dans des 
pr61evements biologiques que celles du kit actuellement disponible. 

Tableau VI: Analyse par RT-PCR en temps reel des ARN extraits d'une serie de 
prelevements de 5 patients a l'aide des couples d'amorces et de sondes de la serie 
n° 2 (N "serie 2") ou du kit "LightCycler SARS-CoV quantification kit" (Roche). 
15 Le type de prSlfcvement est indique ainsi que le nombre de copies de genome viral 
mesurees dans chacun des deux tests. NEG : RT-PCR negative. 



Prelevements n° 


Patient 


Type de prelevement 


KIT ROCHE 


N "s«§rie2" 


20033082 


K 


nasal 


NEG 


NEG 


20033083 


K 


pharynge 


NEG 


NEG 


20033086 


K 


nasal 


NEG 


NEG 


20033087 


K 


pharynge 


NEG 


NEG 


20032802 


M 


nasal 


NEG 


NEG 


20032803 


M 


expectoration 


NEG 


NEG 


20032806 


M 


nasal ou pharynge 


NEG 


NEG 


20031 746ARN2 


C 


pharynge 


NEG 


NEG 


20032711 


C 


nasal ou pharynge 


39 


NEG 


20032910 


B 


nasal 


NEG 


NEG 


20032911 


B 


pharynge 


NEG 


NEG 


20033356 


V 


expectoration 


NEG 


NEG 


20033357 


V 


expectoration 


NEG 


NEG 


20031725 


K 


asp. endotracheal 


NEG 


150 


20032657 


K 


asp. endotracheal 


NEG 


NEG 


20032698 


K 


asp. endotracheal 


NEG 


NEG 


20032720 


K 


asp. endotracheal 


3 


5 


20033074 


K 


selies 


115 


257 


20032701 


M 


pharynge 


443 


1676 


20032702 


M 


expectoration 


NEG 


249 


20031 747ARN2 


C 


pharynge 


NEG 


NEG 


20032712 


C 


inconnu 


634 


6914 


20032714 


C 


pharynge 


17 


223 


20032800 


B 


nasal 


NEG 


NEG 


20033353 


V 


nasai 


NEG 


NEG 


20033384 


V 


nasal 


NEG 


NEG 
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b) Deuxieme etude comparative 

Les performances de differentes m<Sthodes de RT-PCR nichee et de 
RT-PCR en temps reel ont ensnite 6t6 comparers pour 121 prelevements respiratoires 
de cas possibles de SRAS de l'h6pital francais de Hanoi, Vietnam, realises entre le 
5 4 6me et le 17 6me jour apres le debut des symptomes. Parmi ces prelevements, 14 avaient 
ete trouves positifs lors d'un premier test utilisant la methode de RT-PCR nichee 
ciblant l'ORFlb (codant pour la replicase) telle que decrite initialement par le 
Bernhard Nocht Institute (RT-PCR nichee BNI). Des informations concernant ce test 
sont disponibles sur internet, a 1'adresse http://wwwl5.bni- 
10 hamburg.de^^ni2/neu2/eetfile.acei?area engl=diagnostics&pid=41 12 . 

Les differents tests compares dans cette etude sont : 

la methode de RT-PCR quantitative selon l'invention, avec les 
amorces et sonde N "serie 2" decrite ci-dessus (colonne Light 
Cycler N), 

15 - le test de RT-PCR nichee ciblant le gene de TARN polymerase 

decrit ci-dessus 9 dgveloppe par le CDC, le BNI et Tlnstitut 
Pasteur (RT-PCR nichee CDC/IP), 

- le kit ARTUS de reference "HPA Corona LC RT-PCR Kit 
# 5601-02", qui est un test de RT-PCR en temps reel ciblant le 

20 gene ORFlb, 

- le test de RT-PCR nichee du BNI, ciblant egalement le g£ne de 
TARN polymerase, mentionne ci-dessus. 

Les inventeurs ont constate : 

1) une variability inter-test pour une meme technique, ltee a la 
25 degradation de la preparation d' ARN lors de d£congelations repetees, notamment pour 

les echantillons contenant les quantites d'ARN les plus faibles, 

2) une sensibility reduite de la RT-PCR nichee CDC/IP par rapport 
a la RT-PCR nichee BNI, et 

3) une sensibilite comparable du test de RT-PCR quantitative selon 
30 invention (Light Cycler N) par rapport au test Light Cycler (LC) Artus. 

Ces resultats, presentes dans le Tableau VII ci-dessous, montrent que 
le test par RT-PCR quantitative selon invention constitue un excellent complement - 
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ou une alternative - aux tests actuellement disponibles. En effet, le coronavirus U6 au 
SRAS est un virus Emergent, susceptible d'evoluer rapidement. En particulier, le g6ne 
de la RNA polymerase du coronavirus U6 au SRAS, qui est cible dans la plupart des 
tests actuellement disponibles, peut recombiner avec celui d f autres coronavirus non 
5 li<§s au SRAS. L'utilisation d'un test ciblant exclusivement ce gene pourrait alors 
conduire k Pobtention de faux negatifs. 

Le test par RT-PCR quantitative selon ^invention ne cible pas la 
meme region genomique que le kit ARTUS, puisqu'il cible le gene codant pour la 
proteine N. En realisant un test de diagnostique ciblant deux gSnes differents du 
10 coronavirus li6 au SRAS, on peut done esperer s'affiranchir de resultats de type faux 
negatifs, qui pourraient etre dus k revolution genetique du virus. 

De plus, il apparait particulierement avantageux de cibler le gene de la 
proline de nucleocapside, car il est tres stable, du fait de la forte pression de selection 
ltee aux contraintes structurales elev£es concemant cette proline. 

15 
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Tableau VII; Comparaison de differentes mSthodes d'analyse par amplification 
genique, a partir de 121 Pr61fevements de cas probables de SRAS de I'hopital 
fran$ais de Hanoi, Vietnam (6pid6mie 2003) 



N° CNR 


Type 
prelevement 
(1) 


Jour 
prelevement 


Patient 


RT- 
PCR 
nichee 
CDC/IP 


RT- 
PCR 
nichee 
BNI 


kit Light 
Cycler 
Artus 


Light 
Cycler 
N(IP) 


107 
pr6l6vements 


N et P 






N§gatif 


Negatif 


N6gatif 


Negatif 




P 


10 


Mun 

in n d 


in cyciu i 






N&aatif 


032530 


N 


10 


NHB 


Positif 


Positif 


3.10E+01 


4.20E+01 


032531 


p 


7 


LP 


Positif 


Positif 


7.70E+00 


3.10E+00 


032534 


N 


15 


BND 


Positif 


Positif 


1,60E+00 


Negatif 


032600 


P 


4 


NHH 


NSgatif 


Positif 


Negatif 


1.30E+02 


032612 


P 


17 


NTS 


NSgatif 


Positif 


Negatif 


Negatif 


032688 


P 


9 


BTX 


Positif 


Positif 


Negatif 


Negatif 


032689 


N 


4 


NVH 


Positif 


Positif 


1.20E+01 


2.30E+02 


032690 


P 


4 


NVH 


Negatif 


Positif 


1.60E+00 


Negatif 


032727 


P 


8 


NVH 


Positif 


Positif 


2.30E+02 


4.00E+02 


032728 


N 


8 


NVH 


Positif 


Positif 


1.10E+03 


1.60E+04 


032729 


P 


14 


NHB 


Positif 


Positif 


5,90E+00 


3.40E+01 


032730 


N 


14 


NHB 


Positif 


Positif 


1.30E+02 


4.80E+02 


032741 


P 


8 


NHH 


Positif 


Positif 


2.10E+02 


1.30E+02 




positifs 


10 


14 


10 


9 


fraction detectee des 14 positifs 


71,4% 


100,0% 


71,4% 


64,3% 



5 (1) P= ecouvillonage pharyng£ 
N= dcouvillonage nasal 



Exemple 9 : Obtention et caracterisation d'anticorps monoclonaux diriges contre 
la proteine N 

10 Des souris Balb C ont 6t6 immunises k l'aide de la proteine N 

recombinante purifiee et leurs cellules spteniques fusionn6es avec un myelome murin 
appropriS selon les techniques de Kohler et Milstein. 

Dix-neuf hybridomes s6cr6teurs d' anticorps anti N ont 6t6 
pr6selectionnes et leurs immuno reactivites pr6cis£es. Ces anticorps reconnaissent 

15 bien la proline N recombinante (en ELISA) avec des intensites variables, ainsi que la 
proteine virale, naturelle N en ELISA et/ou en Western Blot. Les figures 18 a 20 
montrent les r^sultats de ces tests pour 15 de ces 19 anticorps monoclonaux. 

Les clones 12, 17, 28, 57, 72, 76, 86, 87, 98, 103, 146, 156, 166, 
170, 199, 212, 218, 219 et 222, fortement reactifs, ont 6t6 sous clones. Les etudes de 

20 sp£ciflcit6 ont 6X6 poursuivies avec les outils approprtes afin de pr^ciser les epitopes 
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reconnus et verifier l'absence de r6activit6 vis-£-vis des autres Coronavirus humains et 
de certains virus respiratoires. 

Les etudes de cartographie (mapping) gpitopique (realises sur 
membrane spot, k l'aide de peptides chevauchants de 15 aa) et les Studes 
5 supplementaires realises sur la proline N naturelle en Western Blot ont revels 
l'existence de 4 groupes d'anticorps monoclonaux : 

1° Anticorps monoclonaux specifiques d'un epitope lineaire majeur 
en position N-ter (75-81, sequence : INTNSVP) 

Le repr6sentant de ce groupe est l'anticorps 156. L'hybridome 
10 produisant cet anticorps a 6t6 depose a la Collection Nationale de Cultures de 
Microorganismes (CNCM) de l'lnstitut Patseur (Paris, France) le l er d^cembre 2004, 
sous le numSro 1-3331. Ce meme epitope est 6galement reconnu par un s6rum de 
lapin (polyclonal anti N) obtenu par immunisation classique a l'aide de cette m§me 
proteine N. 

15 2° Anticorps monoclonaux sp^cifiques d'un epitope lin6aire majeur 

situ6 en position centrale (position 217-224, sequence : ETALALL); les repr&entants 
de ce groupe sont les anticorps monoclonaux 87 et 166. L'hybridome produisant 
l'anticorps 87 a et6 depose a la CNCM le l er d6cembre 2004, sous le num<5ro 1-3328. 

3° Anticorps monoclonaux specifiques d'un epitope lineaire majeur 

20 situe en position C-terminale (position 403-408, sequence : DFFRQL), les 
representants de ce groupe sont les anticorps 28, 57 et 143. L'hybridome produisant 
Tariticorps 57 a 6t6 d6pos<5 k la CNCM le l er dScembre 2004, sous le numSro 1-3330. 

4° Anticorps monoclonaux specifiques d'un epitope discontinu, 
conformationel. Ce groupe d'anticorps ne reconnait aucun des peptides recouvrant la 

25 sequence de la proteine N, mais r^agissent fortement sur la proline naturelle non 
d6natur£e. Le representant de ce dernier groupe est l'anticorps 86. L'hybridome 
produisant cet anticorps a 6te depose k la CNCM le l er d£cembre 2004, sous le num6ro 
1-3329. 

Le Tableau VIII ci-apres resume les r^sultats de cartographie 
30 6pitopique obtenus : 



Tableau VIII : Mapping epitopique des anticorps monoclonaux 



Anticorps 


Epitope 


Position 


Region 


28 


DFSRQL Q 


403 ... 408 


C - Ter. 
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143 


DFSRQL Q 






76 


DFSRQL Q 




57 


DFSRQL Q 






Jr Jr Kjivlo JKJ 


31 Q 

OlZV. JJLy 


146 


LPQRQ 


383 ...387 


loo 


FTAT AT.T,// 


21 7 224 


central© 


87 


ETALALL 


217... 224 


156 


INTNSGP 


75... 


JV- Tcr. 


86 


Conformationnel 






212 


Conformationnel 






170 


Conformationnel 







En outre, comme illustre notamment aux figures 18 et 19, ces 
anticorps ne presentent pas de reactivite en ELISA et/ou en WB, vis a vis de la 
proteine N du coronavirus humain 229 E. 
5 Exemple 10 : Combinaisons des anticorps monoclonaux pour Ie developpement 
d'un test d'immunocapture sensible et specifique de l'antigene viral N dans le 
serum ou les fluides biologiques des patients contamines par Ie virus SARS Co V 

Les anticorps listes ci-dessous ont ete retenus en raison de leurs 
propriety bien particulieres pour une 6tude suppl&nentaire de capture et detection de 
10 la proteine virale N, dans le s6rum des sujets ou patients. 

Ces anticorps ont et6 produits en ascite sur souris, purifies par 
chromatographie d'affinit^ et utilises seuls ou en combinaison comme anticorps de 
capture, et comme anticorps signal. 

Liste des anticorps selectionnSs pour le propos : 
1 5 - Acm anti region C-ter (n° 28, 57, 1 43) 

- Acm anti region centrale (n° 87, 166) 

- Acm anti region N-ter (n° 1 56) 

- Acm anti epitope discontinu, conformationnel (86) 
1) Preparation des r6actifs : 

20 &) Plaques ELISA immunocapture 
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Les plaques sont sensibilisees avec les solutions d'anticorps a 5 
Hg/ml en tampon carbonate 0,1 M, pH.9,6. Les solutions (monovalentes ou 
plurivalentes) sont d6posees sous volume de 100 fxl dans les puits et incub£es pendant 
une nuit k temperature ambiante. Ces plaques sont ensuite lav6es en tampon PBS (10 
5 mM pH 7,4 additionne de 0,1% de Tween 20) puis saturSes avec une solution de PBS 
additionnee de 0,3% de BSA et de 5% de Saccharose). Les plaques sont ensuite 
s£ch£es puis conditionnees dans un sachet en presence d'un dessicant Elles sont prdtes 
k l'emploi. 

b) Coniugues 

10 Les anticorps purifies ont 6te couples a la p^roxydase selon le 

protocole de Nakane (Nakane et al. - 1974, J.of Histo and cytochemistry, vol.22, 
pl084-1091) dans un rapport de une molecule d'IgG pour 3 molecules de p&roxydase. 
Ces conjugues ont 6t€ purifies par chromatographie d'exclusion et conserves 
concentres (concentration comprise entre 1 a 2 mg/ml) en presence de 50% de 

15 glycerol et k -20°C. lis sont dilu6s pour leur mise en ceuvre dans les essais k la 
concentration finale de 1 ou 2 jig/ml en tampon PBS (pH 7,4) additionne de 1% de 
BSA. 

c) Autres rgactifs 

- Scrums humains n^gatifs pour tous les marqueurs seriques des virus HIV, HBV, 
20 HCVetTHLV 

- Pool de scrums humains negatifs additionne de 0,5% de Triton X 100 

- Ag viral inactive : surnageant de culture virale inactive par irradiation et 
inactivation v6rifi6e aprds mise en culture sur cellules sensibles - titre de la 
suspension avant inactivation environ 10 7 particules infectieuses par ml ou encore 

25 environ 5x1 0 9 particules virales physiques par ml d'antigene 

- Les 6chantillons d f Ag dilues en serum humain negatif : ces 6chantillons ont 6t6 
pr^par^s par dilution au 1 : 100 e puis par dilution en s6rie de raison 5. 

Ces 6chantillons non infectieux miment des 6chantillons humains supposes 
contenir des concentrations faibles a tres faibles de nucleoprot£ine virale N. De 
30 tels echantillons ne sont pas accessibles pour les travaux de routine 
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- Solution de lavage R2, solution de relation TMB R8, chromogene R9 et solution 
Garret RIO, sont les r<§actifs g6n£riques commercialisms par Bio-Rad dans ses 
trousses ELISA (ex : trousse Platelia Pylori ref.72778). 

5 2) Mode operatoire 

Les echantillons de serums humains surcharges en Ag viral inactive 
sont distributes k raison de 100 ^1 par cupule, directement dans les plaques 
sensibilis<§es, pretes k l'emploi puis incubus pendant 1 heure a 37°C (incubation Bio- 
10 RadlPS). 

Le materiel non retenu par la phase solide est elimine par 3 lavages 
(lavage avec solution R2 dilute, laveur automatique LP 35). 

Les conjuguSs approprtes, diluds k la concentration finale de 1 ou 2 
[ig/ml sont distribu^s k raison de 100 ^1 par cupule et les plaques incub^es k nouveau 
1 5 pendant une heure a 37° C (incubation IPS). 

L'exces de conjugu^ est elimine par 4 lavages successifs (solution 

R2 dilute - laveur LP 35). 

La pr6sence de conjugue fix6 sur les plaques est revetee apres 
addition de 100 |il de solution de r6v61ation pr^paree avant emploi (1 ml de R9 et 10 
20 ml de R8) et apres incubation pendant 30 minutes, a temperature ambiante et a Tabri 
de la lumtere. 

La reaction enzymatique est finalement bloquee par addition de 100 
|il de r<§actif R10 (H2S04 IN) dans toutes les cupules. 

La lecture est effectuee k l'aide d'un lecteur de microplaque 
25 approprie a double longueur d'onde (450/620 nm). 

Les r6sultats peuvent etre interpretes en utilisant comme valeur seuil 
provisoire la moyenne d'au moins deux controles negatifs multiple par un facteur 2 ou 
encore la moyenne de 100 scrums negatifs additionnee d'un increment correspondant k 
6 SD (Standart Deviation calcutee sur les 100 mesures individuelles). 

30 

3) Resultats 

Dififcrentes combinaisons anticorps de capture et anticorps signal ont 
etS testees en se fondant sur les proprtetes des anticorps sSlectionnSs, et en Svitant les 
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combinaisons d'anticorps specifiques des memes epitopes en phase solide et en 
conjugues. 

Les meilleurs resultats ont ete obtenus avec les 4 combinaisons 
listees ci-dessous. Ces r6sultats sont reproduits dans le tableau IX ci-apres. 
5 1. Combinaison F/28 

Phase solide (Acm 166 + 87 region centrale) : conjugue anticorps 28 (C-ter) 

2. Combinaison G/28 

Phase solide (Acm 86 - epitope conformationel) : conjugu6 anticorps 28 (C-ter) 

3. Combinaison H/28 

10 Phase solide (Acms 86, 166 et 87 region centrale et epitope conformationel) : 
conjugue anticorps 28 (C-ter) 

4. Combinaison H/28 + 87 

Phase solide (Acms 86, 166 et 87 region centrale et epitope conformationel) : 
conjugue mixte anticorps 28 (C-ter) et 87 (central) 
15 5. Combinaison G/87 

Phase solide (Acm 86 - epitope conformationel) : conjugu6 anticorps 87 (region 
centrale) 

Les 4 premieres combinaisons presentent des performances 

6quivalentes et reproduces, superieures aux autres combinaisons mises en oeuvre 
20 (comme par exemple la combinaison G/87). Bien entendu, dans ces combinaisons, un 

anticorps monoclonal peut etre remplac6 par un autre anticorps reconnaissant le meme 

Epitope. Ainsi, on peut citer les variantes suivantes : 
6. Variante de la combinaison F/28 

Phase solide (Acm 87 uniquement) : conjugue anticorps 57 (C-ter) 
25 7. Variante de la combinaison G/28 

Phase solide (Acm 86 - Epitope conformationel) : conjuguS anticorps 57 (C-ter) 
8. Variante de la combinaison H/28 

Phase solide (Acms 86 et 87 region centrale et Epitope conformationel) : conjugu6 

anticorps 57 (C-ter) 
30 9. Variante de la combinaison H/28 4- 87 

Phase solide (Acms 86 et 87 region centrale et Epitope conformationel) : conjugue 

mixte anticorps 57 (C-ter) et 87 (central) 
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Tableau IX : Contrdle d'immunoreactivite des Acm anti 
nucleoproteines SARS CoV : densites optiques mesurees avec chaque combinaison 
d'anticorps, en fonction des dilutions de l'antig&ie viral inactive. 



N° 


Dilution 


F/28 


G/28 


G/87 


K H/28 


H/28+87 


0 


1/100 


5 


5 


3,495 


3,900 


5 


1 


1/500 


3,795 


3,814 


1,379 


3,702 


3,804 


2 


14 500 


2,815 


2,950 


0,275 


3,268 


2,680 


3 


1/12 500 


0,987 


1,038 


0,135 


1,374 


0,865 


4 


1/62 500 


0,404 


0,348 


0,125 


0,480 


0,328 


5 


1/312 500 


0,285 


0,211 


0,123 


0,240 


0,215 


6 


T6moin 


0,210 


0,200 


0,098 


0,186 


0,156 


7 


T§moin 


0,269 


0,153 


0,104 


0,193 


0,202 



La limite de detection de ces 4 essais exp6rimentaux correspond k la 
dilution d'antig£ne en s6rum n^gatif 1:62500. Une extrapolation rapide laisse supposer 
la detection de moins de 10 3 particules infectieuses par ml de serums. 

De cette etude, il ressort que les anticorps les mieux approprtes pour 
la capture de la nucleoprotdine virale native sont les anticorps sp£cifiques de la region 
centrale et/ou d'un epitope conformationnel, Tun et l'autre etant des anticorps 
s&ectionnes egalement pour leur forte affinite pour Pantigene natif. 

Ayant determine les meilleurs anticorps pour la composition de la 
phase solide, les anticorps a retenir en priorite pour la detection des antig&nes fixes sur 
la phase solide, sont les anticorps compl&nentaires sp^cifiques d f un epitope dominant 
en region C-ter. L f emploi de tout autre anticorps complementaire, mais specifique des 
Epitopes localises en region N-ter de la proline conduit a des resultats moyens ou 
m^diocres. 

Exemnle 11 ; Systemes d'expression eucaryotes de la proteine de spicule (S) du 
coronavirus associS au SRAS (SRAS-CoV) 

1) Optimisation des conditions d'expression de la S du SRAS-CoV en cellules de 
mammiferes. 

Les conditions d'expression transitoire de la proteine de spicule (S) 
du SRAS-CoV ont ete optimises en cellules de mammiferes (293T, VeroE6). 

Pour cela, un fragment d'ADN contenant le cDNA de la S du SRAS- 
CoV a 6te amplify par PCR k l'aide des oligonucleotides 5 '-ATAGGATCCA 
CCATGTTTAT TTTCTTATTA TTTCTTACTC TCACT-3' et 5 '-ATACTCGAGTT 
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ATGTGTAATG TAATTTGACA CCCTTG-3' a partir du plasmide pSARS-S 
(C.N.C.M. n° 1-3059) puis insert entre les sites BamHl et Xhol du plasmide 
pTRIPAU3-CMV contenant un vecteur lentiviral TRIP (Sirven, 2001, Mol. Ther., 3, 
438-448) pour obtenir le plasmide pTRIP-S. Le fragment BamHl et Xhol contenant 
5 le cDNA de la S a ensuite 6t6 sous-clon6 entre les BamHl et Xhol du plasmide 
d'expression eucaryote pcDNA3.1(+) (Clontech) pour obtenir le plasmide pcDNA-S. 
Le fragment Nhel et Xhol contenant le cADN de la S a ensuite 6t6 sous-clone entre 
les sites correspondants du plasmide d'expression pCI (Promega) pour obtenir le 
plasmide pCI-S. Les sequences WPRE du virus de Hepatite de la marmotte 
10 ("JVoodchuck Hepatitis Virus posttranscriptional regulatory element") et les 
sequences CTE ^constitutive transport element 1 ') du retrovirus simien de Mason- 
Pfizer ont ete ins6rees dans chacun des deux plasmides pcDNA-S et pCI-S entre les 
sites Xhol et Xbal pour obtenir respectivement les plasmides pcDNA-S-CTE, 
pcDNA-S-WPRE, pCI-S-CTE et pCI-S-WPRE (figure 21). Le plasmide pCI-S-WPRE 
15 a ete depose a la CNCM, le 22 novembre 2004, sous le num^ro 1-3323. Tous les 
inserts ont 6t6 sequences a Paide d'un kit BigDye Terminator vl.l (Applied 
Biosystems) et d'un sequenceur automatique ABI377. 

La capacite des plasmides construits h dinger r expression de la S du 
SRAS-CoV dans des cellules de mammiferes a 6t6 recherchee apres transfection de 
20 cellules VeroE6 (figure 22). Dans cette experience, des monocouches de 5x1 0 5 
cellules VeroE6 en boites de Petri de 35mm ont ete transferees avec 2 \xg des 
plasmides pcDNA (a titre de controle), pcDNA-S, pCI et pCI-S et 6 |il de reactif 
Fugene6 selon les indications du fabricant (Roche).. Apres 48 heures d'incubation & 
37°C et sous 5% de CO2, des extraits cellulaires ont 6t6 prepare en tampon de depot 
25 selon Laemmli, s6par6s sur un gel SDS h 8% de polyacrylamide, puis transferees sur 
une membrane de PVDF (BioRad). La detection de cette immunoempreinte (« western 
blot ») a 6t6 realis^e a l'aide d'un serum polyclonal de lapin anti-S (immun-s6rum du 
lapin PI 1 135 : cf exemple 4 ci-dessus) et d'anticorps polyclonaux d'Sne diriges contre 
les IgG de lapin et couples k la peroxidase (NA934V, Amersham). Les anticorps fix6s 
30 ont ete r6v61es par luminescence a l'aide du kit ECL4- (Amersham) et de films 
d'autoradiographie Hyperfilm MP (Amersham). 
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Cette experience (figure 22) montre que le plasmide pcDNA-S ne 
permet pas de diriger l'expression de la S du SRAS-CoV a des niveaux detectables 
tandis que le plasmide pCI-S permet une expression faible, proche de la limite de 
detection, qui peut etre mise en Evidence lorsque le film est surexpose. Des resultats 

5 similaires ont 6te obtenus lorsque l'expression de la S a 6t6 recherchee par 
immunofluorescence (donnees non montr^es). Cette impossibilite de detecter une 
expression efficace de la S ne peut pas etre imputee aux techniques de detection 
utilises puisque la proteine S peut etre mise en Evidence a la taille attendue (180 kDa) 
dans un extrait de cellules infectees par le SRAS-CoV ou dans un extrait de cellules 

10 VeroE6 infectees par le virus recombinant de la vaccine VV-TF7.3 et transferees par 
le plasmide pcDNA-S. Dans cette demise experience, le virus W-TF7.3 exprime 
1'ARN polymerase du phage T7 et permet la transcription cytoplasmique d'un ARN 
non coiffe susceptible d'etre traduit efficacement Cette experience suggere que les 
defauts d'expression decrits ci-dessus sont dus a une incapacite intrins^que du cADN 

15 de la S a etre exprime efficacement lorsque l'etape de transcription en ARN messager 
est r6alis6e au niveau nucleaire. 

Dans une seconde experience, l'effet des signaux CTE et WPRE sur 
l'expression de la S a ete recherchee apres transfection de cellules VeroE6 (figure 
23A) et 293T (figure 23B) et selon un protocole similaire k celui d£crit ci-dessus. 

20 Alors que l'expression de la S ne peut pas etre mis en evidence apres transfection des 
plasmides pcDNA-S-CTE et pcDNA-S-WPRE derives de pcDNA-S, 1'insertion des 
signaux WPRE et CTE amcHiore fortement l'expression de la S dans le contexte du 
plasmide d'expression pCI-S. 

Pour pr£ciser ce resultat, une deuxidme serie d' experiences a ete 

25 realisee, oix l'immunoempreinte est reveiee de fa9on quantitative par luminescence et 
acquisition sur un dispositif d'imagerie numerique (FluorS, BioRad). L'analyse des 
resultats obtenus avec le logiciel QuantityOne v4,2.3 (BioRad) montre que les 
sequences WPRE et CTE augmentent respectivement l'expression de la S d'un facteur 
20 k 42 et 10 k 26 en cellules Vero E6 (Tableau X). En cellules 293T (Tableau X), 

30 l'effet de la sequence CTE est plus modere (4 & 5 fois) tandis que celui de la sequence 
WPRE reste important (13 a 28 fois). 
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Tableau X analyse quantitative de Teffet des signaux CTE et WPRE sur 
^expression de la S du SRAS-CoV : Des extraits cellulaires ont 6t6 pr6pares 48 
heures apr£s transfection de cellulesVeroE6 ou 293T par les plasmides pCI, pCI-S, 
pCI-S-CTE et pCI-S-WPRE et analyses par western blot comme dScrit dans la 
5 legende de la figure 22. Le western blot est r6v6l6 par luminescence (ECL+, 
Amersham) et acquisition sur un dispositif d'imagerie numerique (FluorS, BioRad). 
Les niveaux d'expression sont indiqu6s en fonction d'une dchelle arbitraire ou la 
valeur de 1 reprSsente le niveau mesure apres transfection du plasmide pCI-S. 
Deux experiences ind6pendantes ont dte r&disees pour chacun des deux types 



10 cellulaires. Dans Inexperience 1 sur cellules VeroE6, les transfections ont et6 realisees 
en dupliques et les resultats sont indiqu£s sous la forme de moyennes et ^cart-types 
des niveaux d'expression mesurgs. 



Plasmide 


Cellule 


exp. 1 


exp. 2 


PCI 


VeroE6 


0,0 


0,0 


pCI-S 


VeroE6 


1,0±0,1 


1,0 


pCI-S-CTE 


VeroE6 


9,8 ±0,9 


26,4 


pCI-S-WPRE 


VeroE6 


20,1±2,0 


42,3 


PCI 


293T 


0,0 


0,0 


PCI-S 


293T 


1,0 


1,0 


PCI-S-CTE 


293T 


4,6 


4,0 


PCI-S-WPRE 


293T 


27,6 


12,8 



En resume, Tensemble de ces r6sultats montre que r expression dans 
15 des cellules de mammif&res du cADN de la S du SRAS-CoV sous la dependance de 
sequences promotrices de TARN polymerase II, requiert, pour Stre efficace, la 
presence d'un signal d'epissage ainsi que de Tune ou Pautre des sequences WPRE et 
CTE. 
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2) Obtention de lignees stables permettant l f expression de la S du SRAS-CoV 

Le cADN de la proline S du SRAS-CoV a et6 clon6 sous la forme 
d'un fragment BamHl-Xhol dans le plasmide pTRIPAU3-CMV contenant un vecteur 
5 lentiviral d6fectif TRIP k DNA flap central (Sirven et al, 2001, Mol. Ther., 3 :438- 
448) pour obtenir le plasmide pTRIP-S (figure 24). La co-transfection transitoire selon 
Zennou et al (2000, Cell, 101 : 173-185) de ce plasmide, d'un plasmide 
d'encapsidation (p8.2) et d'un plasmide d'expression de la glycoproteine d'enveloppe 
G du VSV (pHCMV-G) dans des cellules 293T a permis la preparation de 

10 pseudoparticules r&rovirales contenant le vecteur TRIP -S et pseudotypees par la 
proteine d'enveloppe G. Ces vecteurs TRIP-S pseudotyp^s ont ete utilises pour 
transduire des cellules 293T et FRhK-4 : aucune expression de la proteine S n'a pu 
etre mis en evidence par western blot et immunofluorescence dans les cellules 
transduites (donnees non pr6sent6es). 

15 Les cassettes d'expression optimales constitutes du promoteur 

imm6diat/pr6coce du virus CMV, d'un signal d'epissage, du cDNA de la S et de Tun 
ou l'autre des signaux post-transcriptionnels WPRE ou CTE decrites ci-dessus ont 
alors ete substitutes a la cassette EFla-EGFP du vecteur d f expression lentiviral 
defectif a DNA FLAP central TRIPAU3-EFla (Sirven et al, 2001, Mol. Ther., 3 :438- 

20 448) (figure 25). Ces substitutions ont ete realisees par une s6rie de sous-clonages 
successifs des cassettes d'expression de S qui ont 6t6 excistes des plasmides pCT-S- 
CTE (Bglll-Apal) ou respectivement pCI-S-WPRE (Bglll-Sall) puis instrees entre 
les sites Mlul et Kpnl ou respectivement Mlul et Xhol du plasmide TRIPAU3-EFla 
pour obtenir les plasmides pTRIP-SD/SA-S-CTE et pTRIP-SD/SA-S-WPRE, dtposts 

25 a la CNCM, le l er dtcembre 2004, sous les numeros 1-3336 et 1-3334, respectivement. 
Des vecteurs pseudotypes ont 6t6 produits selon Zennou et al (2000, Cell, 101 : 173- 
185) et utilises pour transduire des cellules 293T (10000 cellules) et FRhK-4 (15000 
cellules) selon une serie de 5 cycles successifs de transduction avec une quantite de 
vecteur correspondant a 25 ng (TRIP-SD/SA-S-CTE) ou 22 ng TRIP-SD/SA-S- 

30 WPRE) de p24 par cycle. 

Les cellules transduites ont 6t6 clon£es par dilution limite et une 
s&ie de clones ont 6t€ analyses pour 1' expression de la S du SRAS-CoV 
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qualitativement par immunofluorescence (donn6es non montr^es), puis 
quantitativement par western blot (figure 25) k Paide d'un s6rum polyclonal de lapin 
anti-S. Les r^sultats pr^sentes dans la figure 25 montrent que les clones 2 et 15 de 
cellules FrhK4-s-CTE transduites par TRIP-SD/SA-S-CTE et les clones 4, 9 et 12 de 
5 cellules FRhK4-S-WPRE transduites par TRIP-SD/SA-S-WPRE permettent 
1'expression de la S du SRAS-CoV a des niveaux respectivement faibles et moderns si 
on les compare a ceux que Ton peut observer au cours de l'infection par le SRAS- 
CoV. 

En resume, les vecteurs TRIP-SD/SA-S-CTE et TRIP-SD/SA-S- 

10 WPRE permettent Tobtention de clones stables de cellules FRhK-4 et de fa9on 
similaire 293T exprimant la S du SRAS-CoV, alors que les essais realises avec le 
vecteur n de base" TRIP-S sont restes infructueux, ce qui demontre la n^cessite d'un 
signal d'epissage ainsi que de Tune, ou l'autre, des sequences CTE et WPRE pour 
l'obtention de clones cellulaires stables exprimant la proteine S. 

15 En outre, ces modifications du vecteur TRIP (insertion d'un signal 

d'epissage et d'un signal post-transcriptionnel comme CTE et WPRE) pourraient 
s'av&rer int&ressantes pour ameliorer 1'expression d'autres cDNA que celui de la S. 

3) Obtention de lignees stables permettant 1'expression d'une forme 
soluble de la S du SRAS-CoV. Purification de cet antigene recombinant 

20 Un cDNA codant pour une forme soluble de la proteine S (Ssol) a 

6t6 obtenu en fusionnant les sequences codant pour l'ectodomaine de la prot6ine 
(acides amines 1 a 1193) k celles d'une etiquette (FLAG : DYKDDDDK) via un linker 
BspEl codant pour le dipeptide SG. Pratiquement, pour obtenir le plasmide pcDNA- 
Ssol, un fragment d'ADN codant pour l'ectodomaine de la S du SRAS-CoV a 6t6 

25 amplify par PCR a Paide des oligonucleotides 5 '-ATAGGATCCA CCATGTTTAT 
TTTCTTATTA TTTCTTACTC TCACT-3' et 5'-ACCTCCGGAT TTAATATATT 
GCTCATATTT TCCCAA-3' k partir du plasmide pcDNA-S, puis ins<£r£ entre les 
sites uniques BamHl et BspEl uniques d'un plasmide d'expression eucaryote 
pcDNA3.1(+) (Clontech) modifte contenant entre ses sites BamHl et Xhol la 

30 sequence de 1' Etiquette FLAG : 
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// GGATCC . . .nnn. . . TCC GGA GAT TAT AAA GAT GAC GAC GAT AAA TAA 
BamHl SGDYKDDDDK ter 

CTCGAG // 
Xhol 

5 

Les fragments Nhel-Xhol et BamHl -Xhol, contenant le cADN de 
la S, ont ensuite ete excises du plasmide pcDNA-Ssol, et sous-clones entre les sites 
correspondants du plasmide pTRIP-SD/SA-S-CTE et du plasmide pTRIP-SD/SA-S- 
WPRE, respectivement, pour obtenir les plasmides pTRIP-SD/SA-Ssol-CTE et 

10 pTRIP-SD/SA-Ssol-WPRE, deposes k la CNCM, le l er decembre 2004, sous les 
numeros 1-3337 et 1-3335, respectivement 

Des vecteurs pseudotypes ont 6t6 produits selon Zennou et coll. 
(2000, Cell, 101 : 173-185) et utilises pour transduire des cellules FRhK-4 (15000 
cellules) selon une serie de 5 cycles successifs de transduction (15000 cellules) avec 

15 une quantity de vecteur correspondant k 24 ng (TRIP-SD/SA-Ssol-CTE) ou 40 ng 
TRIP-SD/SA-Ssol-WPRE) de p24 par cycle. Les cellules transduites ont 6te donees 
par dilution limite et une serie de 16 clones transduits par TRIP-SD/SA-Ssol-CTE et 
de 15 clones par TRIP-SD/SA-Ssol-WPRE ont 6t6 analyses pour l'expression du 
polypeptide Ssol par western blot r€v6l6 par un anticorps monoclonal anti-FLAG 

20 (figure 26 et donnees non montrees), ainsi que par un ELISA-capture specifique du 
polypeptide Ssol qui a ete mis au point dans ce but (Tableau XI et donnees non 
montrees). Une partie du processus de selection des meilleurs clones s6creteurs est 
montnS dans la figure 26. L'ELISA-capture repose sur l'utilisation de phases solides 
recouvertes d' anticorps polyclonaux de lapins immunises par du SRAS-CoV purifie et 

25 inactive. Ces phases solides permettent la capture du polypeptide Ssol s6cr6t6 dans les 
surnageants cellulaires, dont la presence est ensuite r6v61ee par une sSrie d'etapes 
impliquant successsivement la fixation d'un anticorps monoclonal anti-FLAG (M2 3 
SIGMA), d' anticorps biotinyles polyclonaux de lapin anti-IgG(H+L) de souris 
(Jackson) et d'un conjugue streptavidine-peroxidase (Amersham) puis Paddition de 

30 chromogene et de substrat (TMB + H 2 0 2 , KPL). 
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Tableau XI : analyse de 1'expression de polypeptide Ssol par des lignees 
cellulaires transduites par Ies vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et 
TRIP-SD/SA-Ssol-CTE. La secretion du polypeptide Ssol a 6t6 recherchee dans le 
surnageant d'une serie de clones cellulaires isoles apres transduction de cellules 



5 FRhK-4 par les vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et TRIP-SD/SA-Ssol- 
CTE. Les surnageants dilues au 1/50 ont 6t€ analyses par un test ELISA-capture 
specifique de la S du SRAS-CoV. 



Vecteur 


Clone 


DO (450 
nm) 


Temoin 




0,031 


TRIP- 
SD/SA-Ssol-CTE 


CTE2 


0,547 


CTE3 


0,668 


CTE9 


0,171 


CTE12 


0,208 


CTE13 


0,133 


TRIP- 
SD/SA-Ssol-WPRE 


WPRE1 


0,061 


WPRE10 


0,134 



La lign6e cellulaire secretant les quantity les plus 61ev6es de 
10 polypeptide Ssol dans le surnageant de culture est la lignSe FRhK4-Ssol-CTE3. Elle a 
ete soumise a une deuxieme serie de 5 cycles de transduction par le vecteur TRIP- 
SD/SA-Ssol-CTE dans des conditions similaires k celles d6crites ci-dessus puis 
clon6e. Le sous-clone secretant les quantity les plus £lev£s de Ssol a et6 selection^ 
par une combinaison d' analyse par western blot et ELISA-capture : il s'agit du sous- 
15 clone FRhK4-Ssol-30, qui a ete depos<§ a la CNCM, le 22 novembre 2004, sous le 
numero 1-3325. 

La lignee FRhK4-Ssol-30 permet la production et la purification en 
quantite du polypeptide recombinant Ssol. Dans une experience type ou les conditions 
exp&imentales de croissance, de production et de purification ont 6t6 optimisees, les 
20 cellules de la lignee FRhK4-Ssol-30 sont ensemencees en milieu de culture standard 
(DMEM sans pyruvate contenant 4.5g/l de glucose et suppl&nente par 5% de SVF, 
100 U/ml de p£nicilline et 100 jag/ml de streptomycine) sous la forme d'une 
monocouche sous-confluente (1 million de cellules pour chaque 100 cm 2 dans 20 ml 
de milieu). A confluence, le milieu standard est remplacS par le milieu de secretion oil 
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la quantity de SVF est abaiss^e a 0.5% et la quantite de milieu r^duite k 16 ml pour 
chaque 100 cm 2 . Le sumageant de culture est pr&eve aprds 4 & 5 jours d' incubation k 
35°C et sous 5% de CO2. Le polypeptide recombinant Ssol est purifid a partir du 
surnageant par 1' enchancement d' Stapes de filtration sur membrane de 
5 polyethersulfone (PES) de 0.1 |um, de concentration par ultrafiltration sur une 
membrane de PES de point de coupure 50kD, de chromatographic d'affinite sur 
matrice anti-FLAG avec elution par une solution de peptide FLAG (DYKDDDDK) a 
100 ^ig/ml en TBS (Tris 50mM pH 7.4, 150 mMNaCl) puis de chromatographie de gel 
filtration en TBS sur billes de sephadex G-75 (Pharmacia). La concentration du 

10 polypeptide recombinant Ssol purifie a 6t6 d&erminee par test micro-BCA (Pierce) 
puis ses caracteristiques biochimiques analysees. 

L'analyse par gel SDS k 8 % d'acrylamide colore au nitrate d'argent 
met en Evidence un polypeptide majoritaire dont la masse moteculaire est d'environ 
180kD et dont le degre de purete peut Stre evalu<5 k 98% (figure 27 A). Par 

15 spectrometrie de masse SELDI-TOF (Cyphergen), deux pics principaux sont mis en 
Evidence : ils correspondent a des formes simplement, et doublement chargees d'un 
polypeptide majoritaire dont la masse moleculaire est ainsi determinee a 182,6 ± 3,7 
kD (figures 27B et C). Apres transfert sur membrane Prosorb et rincage en TFA 0,1%, 
T extremity N-terminale du polypeptide Ssol a ete sequence en phase liquide par 

20 degradation d'Edman sur 5 r^sidus (ABI494, Applied Biosystems) et determinee 
comme etant SDLDR (figure 27D). Ceci demontre que le peptide signal localise k 
Pextr6mite N-terminale de la proteine S du SRAS-CoV, compost des aa 1 k 13 
(MFIFLLFLTLTSG) d'apres une analyse realisee avec le logiciel signalP v2.0 
(Nielsen et al., 1997, Protein Engineering, 10 : 1-6), est cliv6 du polypeptide Ssol 

25 mature. Le polypeptide recombinant Ssol est done constitu£ des acides amines 14 k 
1193 de la proteine S du SRAS-CoV fusionn£s en C-terminal a une sequence 
S GDYKDDDDK contenant la sequence de l'&iquette FLAG (soulign^e). L'Scart 
entre la masse molaire theorique du polypeptide Ssol nu (132,0 kD) et la masse 
molaire reelle du polypeptide mature (182,6 kD) suggdre que le polypeptide Ssol est 

30 glycosyle. 

Une preparation de polypeptide Ssol purifie et dont la concentration 
prot&que a £t£ d6termin6e par test micro-BCA, permet de realiser une gamme etalon 
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pour mesurer a Faide du test ELISA-capture decrit plus haut les concentrations de 
Ssol present dans les surnageants de culture et de revisiter les caracteristiques des 
lignees secretrices. Selon ce test, la lignge FRhK4-Ssol-CT3 secrete 4 & 6 jig/mi de 
polypeptide Ssol tandis que la lign6e FRhK4-Ssol-30 secrete 9 a 13 \xg/ml de Ssol 
5 apres 4 a 5 jours de culture a confluence. En outre, le schema de purification pr^sente 
plus haut permet en routine de purifier de 1 a 2 mg de polypeptide Ssol par litre de 
surnageant de culture. 

Exemple 12 : Immunisation genique visant la proteine de spicule (S) du 
coronavirus associe au SRAS (SRAS-CoV) 
10 L'effet d'un signal d ! 6pissage et des signaux post-transcriptionnels 

WPRE et CTE a et$ analyst apr£s immunisation genique de souris BALB/c (figure 
28). 

Pour cela, des souris BALB/c ont ete immunisees a des intervalles 
de 4 semaines par injection dans le tibialis anterior d'une solution saline de 50 \xg 

15 d'ADN plasmidique de pcDNA-S et pCI-S ainsi que, a titre de contr61e, par 50 \ig 
d'ADN plasmidique de pcDNA-N (dirigeant l'expression de la N du SRAS-CoV) ou 
de pCI-HA (dirigeant l'expression de la HA du virus grippal A/PR/8/34) et les serums 
immuns collectes 3 semaines apres la 2eme injection. La presence d'anticorps diriges 
contre la S du SRAS-CoV a ete recherchee par ELISA indirect en utilisant comme 

20 antigdne un lysat de cellules VeroE6 infectees par le SRAS-CoV et a titre de controle, 
un lysat de cellules VeroE6 non infectees. Les titres (TI) en anticorps anti-SRAS-CoV 
sont calculus comme 1' inverse de la dilution produisant une DO specifique de 0,5 
(difference entre DO mesur^e sur lysat de cellules infectees et DO mesuree sur lysat 
de cellules non infectees) aprSs revelation par un anticorps polyclonal anti-IgG de 

25 souris couple a la peroxidase (NA931V, Amersham) et du TMB additionn6 de H2O2 
(KPL) (figure 28A). 

Dans ces conditions, le plasmide d'expression pcDNA-S ne permet 
l'induction que de faibles titres d'anticorps dirigees contre la S du SRAS-CoV chez 3 
souris sur 6 (LOGio(TT)=l,9±0,6) alors que le plasmide pcDNA-N permet l'induction 

30 d'anticorps anti-N a des titres elev£s (LOGio(TI)= 3,9±0,3) chez tous les animaux, et 
les plasmides contrdles (pCI, pCI-HA) n'entrainent aucun anticorps detectable 
(LOGio(TI)<l,7). Le plasmide pCI-S muni d'un signal d'epissage permet l'induction 
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d'anticorps a des titres elev6s (LOGi 0 (TI)= 3,7±0,2), qui sont environ 60 fois 
superieurs k ceux observes apr&s injection du plasmide pcDNA-S (p<10" 5 ). 

L'efficacite des signaux post-transcriptionnels a 6te etudiee en 
realisant une etude dose-reponse des titres en anticorps anti-S induits chez la souris 
5 BALB/c en fonction de la quantite d'ADN plasmidique utilise comme immunogdne 
(2(ag, 10 jig et 50 fig). Cette etude (figure 28B) demontre que le signal post- 
transcriptionnel WPRE am&iore fortement Tefficacit^ de Timmunisation genique 
lorsque de faibles doses d'ADN sont utilises (p<10" 5 pour une dose de 2 [xg d'ADN et 
p<10" 2 pour une dose de 10 jig), alors que l'effet du signal CTE reste marginal (p=0,34 
1 0 pour vine dose de 2 |ug d'ADN). 

Enfin, les anticorps induits chez la souris apres immunisation 
g6nique neutralised l'infectivite du SRAS-CoV in vitro (figures 29A et 29B) k des 
titres qui sont en rapport avec les titres mesures par ELISA. 

En resume, l'utilisation d'un signal d'6pissage et du signal post- 
15 transcriptionnel WPRE du virus de l'hepatite de la marmotte am61iore de fa9on 
considerable l'induction d'anticorps neutralisants diriges contre le SRAS-CoV aprds 
immunisation genique a l'aide d'ADN plasmidique dirigeant Pexpression du cADN 
de la S du SRAS-CoV. 

Exemple 13 ; Applications diagnostiques de la proteine S 

20 La reactivite en ELISA du polypeptide recombinant Ssol a ete 

analysee vis-a-vis de scrums de patients atteints de SRAS. 

Les scrums de cas probables de SRAS testes ont 6te choisis sur la 
base des resultats (positifs ou n^gatifs) d'analyse de leur r6activit6 spScifique vis-a-vis 
des antig&ies natifs du SRAS-CoV par test d'immunofluorescence sur cellules 

25 VeroE6 infectees par le SRAS-CoV et/ou par test ELISA indirect en utilisant comme 
antigene un lysat de cellules VeroE6 infectees par le SRAS-CoV. Les serums de ces 
patients sont identifies par un num&ro d'ordre du Centre National de Reference des 
Virus Influenzae ainsi que par les initiales du patient et le nombre de jours 6coules 
depuis le debut des symptomes. Tous les serums de cas probables (cf Tableau XII) 

30 reconnaissent les antigenes natifs du SRAS-CoV, k l'exception du s6rum 032552 du 
patient VTT, pour lequel l'infection par le SRAS-CoV n'a pas pu etre confirmee par 
RT-PCR realisSe sur prelevements respiratoires des jours 3, 8 et 12. Un panel de 
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s6rums temoin a ete utilise a titre de controle (s6rums TV): il s'agit de scrums pr£lev6s 
en France avant l'£pid6mie de SRAS survenue en 2003. 
Tableau XII : serums de cas probables de SRAS 



serum 


patient 


jour de prelevement 


031724 


JYK 


7 


033168 


JYK 


38 


033597 


JYK 


74 


032632 


NTM 


17 


032634 


THA 


15 


032541 


PHV 


10 


032542 


NIH 


17 


032552 


VTT 


8 


032633 


PTU 


16 


032791 


J LB 


3 


033258 


J LB 


27 


032703 


JCM 


8 


033153 


JCM 


29 



5 Des phases solides sensibilisees par le polypeptide recombinant Ssol 

ont 6t6 preparees par adsorption d'une solution de polypeptide Ssol purifte a 2 \xg/ml 
en PBS dans les puits d'une plaque ELISA, puis les plaques sont incubees une nuit k 
4°C et lavSes avec du tampon PBS-Tween (PBS, 0,1% Tween20). Aprds saturation 
des plaques ELISA par une solution de PBS-lait ecreme k 10% (poids/volume) et 

10 lavage en PBS-tween, les serums a tester (100 \xl) sont dilues au 1/400 dans du tampon 
PBS-lait ecr<§me-Tween (PBS, 3% lait 6crem6, 0,1% Tween) puis ajoutes dans les 
puits de la plaque ELISA sensibilisee. Les plaques sont incubees lh a 37°C. AprSs 3 
lavages avec du tampon PBS-Tween, le conjugue anti-IgG humaines marqu6 a la 
peroxidase (r6f NA933V, Amersham) dilu6 au 1/4000 dans du tampon PBS-lait 

15 ecr&n6-Tween est ajoute, puis les plaques sont incubees une heure a 37°C. AprSs 6 
lavages avec du tampon PBS-Tween, le chromogdne (TMB) et le substrat (H 2 0 2 ) sont 
ajoutes et les plaques sont incubees 10 minutes a Pabri de la lumidre. La reaction est 
arretee par ajout d'une solution IN de H3PO4, puis Pabsorbance est mesurSe a 450 nm 
avec un reference k 620nm. 
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Les tests ELISA (figure 30) ctemontrent que le polypeptide 
recombinant Ssol est reconnu sp^cifiquement par les anticorps s&iques de patients 
atteints de SRAS pr^leves en phase moyenne ou tardive de P infection (> 10 jours 
apr£s le debut des symptomes alors qu'il n'est pas reconnu de fa<?on significative par 
5 les anticorps s6riques de deux patients (JLB et JCM) pr61ev6s en phase pr^coce de 
T infection (3 & 8 jours apres le debut des symptdmes) ni par des serums temoins de 
sujets non atteints de SRAS. Les anticorps s6riques des patients JLB et JCM montrent 
une seroconversion entre les jours 3 et 27 pour le premier et 8 et 29 pour le second 
apr£s le d£but des symptomes, ce qui confirme la spScificite de la r6activite de ces 

10 serums vis-a-vis du polypeptide Ssol. 

En conclusion, ces resultats d&nontrent que le polypeptide 
recombinant Ssol peut etre utilise comme antigene pour la mise au point d'un test 
ELISA de diagnostic sSrologique de l'infection par le SRAS-CoV. 
Exemple 14 : Applications vaccinales de la proteine S soluble recombinante 

15 L'immunog&iicit6 du polypeptide recombinant Ssol a 6t6 etudiee 

chez la souris. 

Pour cela, un groupe de 6 souris a 6t6 immunise a 3 semaines 
d'intervalle avec 10 jag de polypeptide recombinant Ssol adjuve par 1 mg d'hydroxyde 
d'aluminium (Alu-gel-S, Serva) dilue en PBS. Trois immunisations successives ont 

20 et6 r£alisees et les scrums immuns ont 6t6 prelev^s 3 semaines apres chacune des 
immunisations (IS1, IS2 5 IS3). A titre de controle, xm groupe de souris (groupe mock) 
a re9u de Thydroxide d'aluminium seul selon le meme protocole. 

Les serums immuns ont et6 analyses par pool pour chacun des 2 
groupes par ELISA indirect en utilisant un lysat de cellules VeroE6 infectees par le 

25 SRAS-CoV comme antigfene et k titre de controle, un lysat de cellules VeroE6 non 
infectSes. Les titres en anticorps anti-SRAS-CoV sont calcules comme T inverse de la 
dilution produisant une DO sp^cifique de 0,5 aprds revelation par un anticorps 
polyclonal anti-IgG(H+L) de souris couple a la peroxidase (NA931V, Amersham) et 
du TMB additionn6 de H2O2 (KPL). Cette analyse (figure 31) montre que 

30 T immunisation par le polypeptide Ssol induit chez la souris d&s la premiere 
immunisation des anticorps dirig^s contre la forme native de la proline de spicule du 
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SRAS-CoV presente dans le lysat de cellules VeroE6 infectees. Apres 2 puis 3 
immunisations, les titres en anticorps anti-S deviennent tres eleves. 

Les scrums immuns ont 6te analyses par pool pour chacun des 2 
groupes pour leur capacity a seroneutraliser 1'infectivite du SRAS-CoV. 4 points de 

5 seroneutralisation sur cellules FRhK-4 (100 TCID50 de SRAS-CoV) sont realises 
pour chacune des dilutions de raison 2 testees a partir du 1/20. Le titre seroneutralisant 
est calcule selon la methode de Reed et Munsch comme l'inverse de la dilution 
neutralisant 1'infectivite de 2 cupules sur 4. Cette analyse montre que les anticorps 
induits chez la souris par le polypeptide Ssol sont neutralisants : les titres observes 

10 sont tres eleves apres 2 puis 3 immunisations (superieurs a 2560 et 5120 
respectivement, Tableau XIII). 

Tableau XIII : induction d'anticorps diriges contre le SRAS- 
CoV apres immunisation avec le polypeptide recombinant Ssol. Les serums 
immuns ont ete analyses par pool pour chacun des 2 groupes pour leur capacitd a 

15 seroneutraliser 1'infectivite de 100 TCID50 du SRAS-CoV sur cellules FRhK-4. 4 
points sont realises pour chacune des dilutions de raison 2 testees & partir du 1/20. Le 
titre seroneutralisant est calcul6 selon la methode de Reed et Munsch comme l'inverse 
de la dilution neutralisant l'infectivite de 2 cupules sur 4. 



groupe 


serums 


Ac. Neutralisants 


Mock 


P' 


< 20 


IS1 


< 20 


IS2 


< 20 


IS3 


< 20 


Ssol 


Pi 


< 20 


IS1 


57 


IS2 


> 2560 


IS3 


> 5120 



20 Les titres neutralisants observes chez les souris immunisees avec le 

polypeptide Ssol atteignent des niveaux tres supeneurs aux titres observes par Yang et 
coll. chez la souris (2004, Nature, 428: 561-564) et a ceux observes par Buchholz chez 
le hamster (2004, PNAS 101 : 9804-9809), qui protegent respectivement la souris et le 
hamster de l'infection par le SRAS-CoV. II est done vraisemblable que les anticorps 
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neutralisants induits chez la souris apr£s immunisation par le polypeptide Ssol 
protegent ces animaux contre Tinfection par le SRAS-CoV. 

Exemple 15 : G£ne synthetique optimist pour Fexpression en cellules de 
mammiferes de la proteine de spicule (S) du coronavirus assocte au SRAS 
5 (SRAS-CoV). 

1) Conception du gene synthetique 

Un g£ne synthetique codant pour la proteine de spicule du SRAS- 

CoV a 6t6 con9U k partir du g£ne de l'isolat 031589 (plasmide pSARS-S, C.N.C.M . 
n° 1-3059) de fa<;on a permettre des niveaux d'expression eleves dans des cellules de 
10 mammiferes et en particulier dans les cellules d'origine humaine. 

Pour cela : 

- l'usage des codons du g&ne sauvage de l'isolat 031589 a 6t6 
modifie de fa9on k se rapprocher du biais observe chez rhornme et a ameiiorer 
Fefficacite de traduction du mRNA correspondant 

15 - le contenu global en GC du gene a 6te augment^ de fa?on k 

prolonger la demi-vie du mRNA correspondant 

- les motifs, eventuellement cryptiques, susceptibles d'interferer 
avec une expression efficace du gene ont et6 supprim6s (sites donneurs et accepteurs 
d^pissage, signaux de polyadenylation, sequences tres riches (>80%) ou trds pauvres 

20 (<30%) en GC, sequences rep6t6es, sequences impliqu^es dans la formation de 
structures secondares de TARN, boites TATA) 

- un deuxieme codon STOP a 6t6 ajoute pour permettre une 
terminaison efficace de la traduction. 

En outre, des motifs CpG ont ete introduits dans le g&ne de fa9on a 
25 augmenter son immunog6nicit6 comme vaccin k ADN. Afin de faciliter la 
manipulation du g£ne synthetique, deux sites de restriction BamHl et Xhol ont ete 
places de part et d' autre de la phase ouverte de lecture de la proteine S, et les sites de 
restriction BamHl, Xhol, Nhel, Kpnl, BspEl et Sail ont ete evites dans le gene 
synthetique. 

30 La sequence du gdne synthetique con?u (gene 040530) est donnee en 

SEQ ID No: 140. 
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Un alignement du g£ne synthetique 040530 avec la sequence du 
g£ne sauvage de l'isolat 031589 du SRAS-CoV depose k la C.N.CM. sous le munero 
1-3059 (SEQ ID NO : 4, plasmide pSRAS-S) est pr^sente dans la figure 32. 

2) Constructions plasmidiques 

5 Le gene synthetique SEQ ID No: 140 a 6t6 assemble k partir 

d' oligonucleotides synthetiques et clone entre les sites Kpnl et Sacl du plasmide 
pUC-Kana pour donner le plasmide 040530pUC-kana. La sequence nucleotidique de 
l'insert du plasmide 040530pUC-kana a ete v6rifi6e par s6quen?age automatique 
(Applied). 

10 Un fragment Kpnl-Xhol contenant le gene synthetique 040530 a ete 

excise du plasmide 040530pUC-kana et sous-clone entre les sites Nhel et Xhol du 
plasmide d'expression pCI (Promega) pour obtenir le plasmide pCI-SSYNTH, depose k 
la CNCM le l er decembre 2004, sous le numero 1-3333. 

Un gene synthetique codant pour la forme soluble de la proteine S a 

15 ensuite ete obtenu en fusionnant les sequences synthetiques codant pour 
Pectodomaine de la proteine S (acides amines 1 a 1193) a celles de l'etiquette (FLAG 
: DYKDDDDK) via un linker BspEl codant pour le dipeptide SG. Pratiquement, un 
fragment d'ADN codant pour rectodomaine de la S du SRAS-CoV a ete amplifie par 
PCR k 1'aide des oligonucleotides 5 ' - ACT AGCTAGC GGATCCA CCA 

20 TGTTCATCTT CCTG -3' et 5'- AGT ATCCGGA C TTGATGTACT GCTCGTACTT 
GC-3 5 k partir du plasmide 040530pUC-kana, dig6r6 par Nhel et BspEl puis insere 
entre les sites uniques Nhel et BspEl du plasmide pCI-Ssol, pour donner le plasmide 
pCI-ScUBE, depose k la CNCM le l er decembre 2004, sous le numero 1-3332. (Les 
plasmides pCI-Ssol, pCI-Ssol-CTE et pCI-Ssol-WPRE (depose a la CNCM, le 22 

25 novembre 2004, sous le numero 1-3324) avaient ete precedemment obtenus par sous- 
clonage du fragment Kpnl-Xhol excise du plasmide pcDNA-Ssol (voir note 
technique de la DI 2004-106) entre les sites Nhel et Xhol des plasmides pCI, pCI-S- 
CTE et pCI-S-WPRE respectivement.) 

Les plasmides pCI-Scube et pCI-Ssol codent pour le meme 

30 polypeptide recombinant SsoL 

3) Resultats 
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La capacity du gdne synth&ique codant pour la proline S k dinger 
efficacement P expression de la S du SRAS-CoV dans des cellules de mammiferes a 
6te comparee a celle du g£ne sauvage aprds transfection transitoire de cellules de 
primates (VeroE6) et de cellules humaines (293 T). 
5 Dans 1' experience presentee par la figure 33 et au Tableau XIV, des 

monocouches de 5x1 0 5 cellules VeroE6 ou 7xl0 5 cellules 293T en boites de Petri de 
35mm ont ete transferees avec 2 jig des plasmides pCI (a titre de contr61e), pCI-S, 
pCI-S-CTE, pCI-S-WPRE et pCI-Ssynth et 6 \i\ de reactif Fugene6 selon les 
indications du fabricant (Roche). Apres 48 heures d'incubation a 37°C et sous 5% de 

10 C0 2 , des extraits cellulaires ont 6t6 prepares en tampon de depot selon Laemmli, 
separ6s sur un gel SDS a 8% de polyacrylamide puis transferes sur une membrane de 
PVDF (BioRad). La detection de cette immunoempreinte (« western blot») a 6t6 
r£alis£e k Paide d'un serum polyclonal de lapin anti-S (immun-s6rum du lapin 
PI 1135 : cf exemple 4 ci-dessus) et d'anticorps polyclonaux d'ane diriges contre les 

15 IgG de lapin et couples a la peroxidase (NA934V, Amersham). L'immunoempreinte 
est rev£l£e de fa9on quantitative par luminescence a Paide du kit ECL+ (Amersham) 
et acquisition sur un dispositif d'imagerie numerique (FluorS, BioRad). 

L'analyse des r£sultats obtenus avec le logiciel QuantityOne v4.2.3 
(BioRad) montre que dans cette experience, le plasmide pCI-Synth permet 

20 Pexpression transitoire de la prot&ne S a des niveaux eleves dans les cellules VeroE6 
et 293T, alors que le plasmide pCI-S ne permet pas d'induire une expression a des 
niveaux suffisants pour Stre detectee. Les niveaux d'expression observes sont de 
Pordre de 2 fois sup&ieurs k ceux observes avec le plasmide pCI-S-WPRE. 
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10 



Tableau XIV : utilisation d'un gene synth^tique pour I'expression de la S du 
SRAS-CoV. Des extraits cellulaires prepares 48 hevires apres transfection de 
cellulesVeroE6 ou 293T par les plasmides pCI, pCI-S, pCI-S-CTE, pCI-S-WPRE et 
pCI-Ssynth ont 6t6 s6pares sur un gel SDS a 8% d'acrylamide et analyses par western 
blot a l'aide d'un anticorps polyclonal de lapin anti-S et d'un anticorps polyclonal 
anti-IgG(H+L) de lapin couple a la peroxidase (NA934V, Amersham). Le western 
blot est revile par luminescence (ECL+, Amersham) et acquisition sur un dispositif 
d'imagerie numerique (FluorS, BioRad). Les niveaux d'expression de la proteine S 
ont ete mesures en quantifiant les 2 bandes majoritaires reper^es sur T image (voir 
figure 33) et sont indiques en fonction d'une echelle arbitraire ou la valeur de 1 



plasmide 


VeroE6 


293T 


pCI 


0,0 


0,0 


pCI-S 


< 0,1 


< 0,1 i 


pCI-S-CTE 


0,5 


< 0,1 


pCI-S-WPRE 


1,0 


1,0 


PCI-Ssynth 


1,8 


1,9 



Dans un second temps, la capacity du g£ne synthetique Scube a 
diriger efficacement la synthese et la secretion du polypeptide Ssol par des cellules de 

15 mammiferes a ete comparee k celle du gene sauvage apres transfection transitoire de 
cellules de hamster (BHK-21) et de cellules humaines (293 T). 

Dans Pexperience pr6sent£e par le Tableau XV, des monocouches 
de 6x10 s cellules BHK-21 et de 7xl0 5 cellules 293T en boites de Petri de 35mm ont 
6t6 transferees avec 2 jag des plasmides pCI (a titre de controle), pCI-Ssol, pCI-Ssol- 

20 CTE, pCI-Ssol-WPRE et pCI-Scube et 6 jil de r6actif Fugene6 selon les indications du 
fabricant (Roche). Apres 48 heures d'incubation a 37°C et sous 5% de C02, les 
surnageants cellulaires ont 6t6 pr£leves et analyses de fa?on quantitative pour la 
secretion du polypeptide Ssol par un test ELISA-capture specifique du polypeptide 
Ssol. 

25 L'analyse des r^sultats montre que, dans cette experience, le 

plasmide pCI-Scube permet I'expression du polypeptide Ssol a des niveaux 8 fois 
(cellules BHK-21) k 20 fois (cellules 293 T) plus eleves que le plasmide pCI-SsoL Les 
niveaux d'expression observes sont de l'ordre de 2 fois (cellules 293T) a 5 fois 
(cellules BHK-21) sup£rieurs h ceux observes avec le plasmide pCI-Ssol-WPRE. 

30 
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Tableau XV : utilisation d'un gfcne synthetique pour 1' expression du polypeptide 
Ssol. Les surnageants ont 6t6 recolt^s 48 heures aprds transfection de cellules BHK ou 
293T par les plasmides pCI, pCI-Ssol, pCI-Ssol-CTE, pCI-Ssol-WPRE et pCI-Scube 
et analyses de fa9on quantitative pour la secretion du polypeptide Ssol par un test 
5 ELISA-capture sp^cifique du polypeptide Ssol. Les transfections ont 6te realisees en 
dupliqu6s et les r^sultats sont indiques sous la forme de moyennes et ecart-types des 
concentrations de polypeptide Ssol (ng/ml) mesur^es dans les surnageants. 



Plasmide 


BHK 


293T 


Pci 


< 20 


< 20 


pCI-Ssol 


< 20 


56 ± 10 


pCI-Ssol-CTE 


< 20 


63 ± 8 


pCI-Ssol-WPRE 


28 ± 1 


531 ± 15 


PCI-Scube 


152 ± 6 


1140 ± 20 



10 En resume, ces r^sultats montrent que 1' expression dans des cellules 

de mammiferes du gene synthetique 040530 codant pour la S du SRAS-CoV sous la 
dependance de sequences promotrices de TARN polymerase II est bien plus efficace 
que celle du gene sauvage de Pisolat 031589. Cette expression est mSme plus efficace 
que celle dirigee par le gene sauvage en presence des sequences WPRE du virus de 

1 5 Phepatite de la marmotte, 
4) Applications 

L'utilisation du gdne synthetique 040530 codant pour la S du SRAS- 
CoV ou de sa variante Scube codant pour le polypeptide Ssol est susceptible de 
remplacer avantageusement le g£ne sauvage dans de nombreuses applications ou 
20 Pexpression de la S est necessaire & des niveaux £lev6s. En particulier pour : 

- ameiiorer Pefficacite de P immunisation g^nique par des plasmides 
du type pCI-Ssynth voire pCI-Ssynth-CTE ou pCI-Ssynth-WPRE 

- etablir de nouvelles lign6es cellulaires exprimant des quantites plus 
eievees de la proteine S ou du polypeptide Ssol a Paide de vecteurs lentiviraux 

25 recombinants porteurs du gene Ssynth ou du gene Scube respectivement 

- am61iorer Pimmunog£nicit£ des vecteurs lentiviraux recombinants 
permettant Pexpression de la proteine S ou du polypeptide Ssol 

- ameliorer Pimmunog6nicite de vecteurs vivants permettant 
Pexpression de la proteine S ou du polypeptide Ssol comme des virus recombinants de 

30 la vaccine ou des virus rougeole recombinants (voir exemples 16 et 17 ci-apres) 
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Exemple 16 : Expression de la proteine de spicule (S) du coronavirus associe au 
* SRAS (SRAS-CoV) a Taide de virus recombinants de la Vaccine. 
Application vaccinale. 

Application a la production d f une forme soluble de la proteine de spicule (S) et 
5 conception d ? un test de serologic du SRAS. 
1) Introduction 

Le but de cet exemple est d'evaluer la capacite de virus 
recombinants de la vaccine (W) exprimant diffSrents antigenes du coronavirus 
associe au SRAS (SRAS-CoV) a constituer de nouveaux candidats vaccins contre le 
10 SRAS et un moyen de produire des antigenes recombinants en cellules de 
mammiffcres. 

Pour cela, les inventeurs se sont int6ress6s a la proline de spicule 
(S) du SRAS-CoV, qui permet d'induire apres immunisation g&iique chez Tanimal 
des anticorps neutralisants I'infectivite du SRAS-CoV, ainsi qu'a une forme soluble et 

15 secretee de cette proteine, le polypeptide Ssol, qui est compost de l'ectodomaine (aa 
1-1 193) de la S fusionnS en son extremity C-ter k une etiquette FLAG (DYKDDDDK) 
via un linker BspEl codant pour le dipeptide SG. Ce polypeptide Ssol presente une 
antigenicity similaire k celle de la proteine S et permet, apres injection a la souris sous 
la forme d'une proteine purifi^e adjuvee en hydroxide d'aluminium, Tinduction de 

20 titres eleves d'anticorps neutralisants contre le SRAS-CoV. 

Les difKrentes formes du gene S ont etS plac£es sous la d^pendance 
du promoteur du gene 7.5K puis introduces au sein du locus de la thymidine kinase 
(TK) de la souche Copenhague du virus de la vaccine par double recombinaison 
homologue in vivo. Afin d'am&iorer l 5 immunog6nicite des virus vaccine 

25 recombinants, un promoteur tardif synthetique a 6t6 choisi a la place du promoteur 
7.5K, pour augmenter la production de S et Ssol au cours des phases tardives du cycle 
viral. 

Apres avoir isole les virus vaccine recombinants et verifte leur 
capacite a exprimer Tantigene S du SRAS-CoV, leur capacity a induire chez la souris 
30 une rSponse immunitaire contre le SRAS a 6te testee. Apres avoir purifte Tantigene 
Ssol du surnageant de cellules infectees, un test ELISA de s&rodiagnostic du SRAS a 
&6 congu, et son efficacite a 6t6 6valu6e k Paide de scrums de cas probables de SRAS. 
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2) Construction des virus recombinants 

Des virus recombinants de la vaccine dirigeant 1* expression de la 
glycoprotdine S de 1'isolat 031589 du SRAS-CoV et d'une forme soluble et secretee 
de cette proteine, le polypeptide Ssol, sous la dependance du promoteur 7.5K ont 6te 
5 obtenus. Dans le but d'augmenter les niveaux d'expression de S et Ssol, des virus 
recombinants dans lesquels les cDNA de S et de Ssol sont places sous la dependance 
d'un promoteur synthetique tardif ont Sgalement 6te obtenus. 

Le plasmide pTG186poly est un plasmide de transfert pour la 
construction de virus recombinants de la vaccine (Kieny, 1986, Biotechnology, 

10 4 : 790-795). A ce titre, il contient le gene de la thymidine kinase du W dans lequel a 
et£ insere le promoteur du gene 7.5K suivi d'un site multiple de clonage permettant 
l'insertion de genes h£terologues (figure 34A). Le promoteur du g£ne 7.5K contient en 
fait un tandem de deux sequences promotrices actives respectivement durant les 
phases precoces (Pe) et tardives (Pl) du cycle de replication du virus de la vaccine. 

15 Les fragments BamHl-Xhol ont 6t6 excises des plasmides pTRIP-S et pcDNA-Ssol 
respectivement et inseres entre les sites BamHl et Smal du plasmide pTG186poly 
pour donner les plasmides pTG-S et pTG-Ssol (figure 34A). Les plasmides pTG-S et 
pTG-Ssol ont 6t6 deposes a la CNCM, le 2 decembre 2004, sous les numeros 1-3338 et 
1-3339, respectivement 

20 Les plasmides pTN480, pTN-S et pTN-Ssol ont 6te obtenus a partir 

des plasmides pTG186poly, pTG-S et pTG-Ssol respectivement, en substituant le 
fragment Ndel-Pstl contenant le promoteur 7.5K par un fragment d'ADN contenant 
le promoteur tardif synthetique 480, qui a 6t6 obtenu par hybridation des 
oligonucleotides 5'- TATGAGCTTT TTTTTTTTTT TTTTTTTGGC 

25 ATATAAATAG ACTCGGCGCG CCATCTGCA-3' et 5'- GATGGCGCGC 
CGAGTCTATT TATATGCCAA AAAAAAAAAA AAAAAAAAGC TCA-3' 
(figure 34B). L'insert a et6 s6quenc6 k l'aide d'un kit BigDye Terminator vLl 
(Applied Biosystems) et d'un sequenceur automatique ABI377. La sequence du 
promoteur synthetique tardif 480 tel que clone dans les plasmides de transfert de la 

30 serie pTN est indiquee figure 34C. Les plasmides pTN-S et pTN-Ssol ont 6te deposes 
^ la CNCM, le 2 decembre 2004, sous les numeros 1-3340 et 1-3341, respectivement 
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Les virus recombinants de la vaccine ont 6t€ obtenus par double 
recombinaison homologue in vivo entre la cassette TK des plasmides de transfert des 
series pTG et pTN et le g£ne TK de la souche Copenhague du virus de la vaccine 
selon une procedure decrite par Kieny et coll. (1984, Nature, 312: 163-166). 
5 Brtevement, des cellules CV-1 sont transferees a l'aide de DOTAP (Roche) par de 
PADN g^nomique de la souche copenhague du virus de la vaccine et chacun des 
plasmides de transfert des series pTG et pTN decrits ci-dessus, puis surinfectees par le 
virus vaccine auxiliaire VV-ts7 pendant 24 heures a 33°C. Le virus auxiliaire est 
contre-selectionne par incubation £ 40°C pendant 2 jours puis les virus recombinants 

10 (phenotype TK-) selectionn^s par deux cycles de clonage sous milieu gelose sur 
cellules 143Btk- en presence de BuDr (25 fxg/ml). Les 6 virus W-TG, VV-TG-S, 
W-TG-Ssol, W-TN, W-TN-S et W-TN-Ssol ont 6t6 respectivement obtenus a 
l'aide des plasmides de transfert pTG186poly, pTG-S, pTG-Ssol, pTN480, pTN-S, 
pTN-Ssol. Les virus VV-TG et W-TN n'expriment aucun gene h^terologue et ont 6t6 

15 utilises comme controle TK- dans les experiences. Les preparations de virus 
recombinants ont 6t6 realises sur monocouches de cellules CV-1 ou BHK-21 et le titre 
en unites formant plage (u.f.p.) determine sur cellules CV-1 selon Earl et Moss (1998, 
Current Protocols in Molecular Biology, 16.16.1-16.16.13). 
3) Caracterisation des virus recombinants 

20 L'expression des transgenes codant la proteine S et le polypeptide 

Ssol a ete recherchee par western blot. 

Des monocouches de cellules CV-1 ont ete infectees a une 
multiplicite de 2 par les differents virus vaccine recombinants VV-TG, VV-TG-S, 
VV-TG-Ssol, W-TN, W-TN-S et W-TN-Ssol. Apres 18 heures d'incubation a 

25 37°C et sous 5% de C02, des extraits cellulaires ont ete prepares en tampon de depot 
selon Laemmli, separes sur un gel SDS a 8% de polyacrylamide puis transferes sur 
une membrane de PVDF (BioRad). La detection de cette immunoempreinte (« western 
blot ») a ete realisee a Taide d'un serum polyclonal de lapin anti-S (immun-serum du 
lapin PI 1135 : cf exemple 4) et d'anticorps polyclonaux d'Sne diriges contre les IgG 

30 de lapin et couples a la peroxidase (NA934V, Amersham). Les anticorps fixes ont ete 
reveies par luminescence a Paide du kit ECL+ (Amersham) et de films 
d' autoradiographic Hyperfilm MP (Amersham). 
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Comme le montre la figure 3 5 A, le virus recombinant VV-TN-S 
dirige F expression de la prot6ine S k des niveaux qui sont comparables a ceux que 
l'on peut observer 8h apr6s infection par le SRAS-CoV mais qui sont bien plus elev6s 
que ceux que l'on peut observer aprds infection par W-TG-S. Dans une deuxieme 
5 experience (figure 35B), 1' analyse de quantity variables d'extraits cellulaires montre 
que les niveaux d'expression observes aprds infection par les virus de la serie TN 
(VV-TN-S et VV-TN-Ssol) sont environ 10 fois plus elev6s que ceux observes avec 
les virus de la serie TG (VV-TG-S et VV-TG-Ssol respectivement). En outre, le 
polypeptide Ssol est secrete dans le surnageant de cellules CV-1 infectees par le virus 

10 VV-TN-Ssol plus efficacement que dans le surnageant de cellules infectees par VV- 
TG-Ssol (figure 36A). Dans cette experience, le virus VV-TN-Sflag a ete utilise a titre 
de controle, car il exprime la forme membranaire de la proteine S fusionn6e en son 
extremity C-ter a P Etiquette FLAG. La proteine Sflag n'est pas detectee dans le 
surnageant des cellules infectees par VV-TN-Sflag, demontrant que le polypeptide 

1 5 Ssol est bien s£cr6t£ de fa9on active apres infection par W-TN-Ssol. 

Ces resultats d&nontrent que les virus vaccine recombinants sont 
bien porteurs des transg&ies et permettent V expression de la glycoprot^ine du SRAS 
sous sa forme membranaire (S) ou sous une forme soluble et s6cr6tee (Ssol). Les virus 
vaccine porteurs du promoteur synth&ique 480 permettent Fexpression de S et la 

20 secretion de Ssol k des niveaux bien plus elev6s que les virus porteurs du promoteur 
du gene 7.5K. 

4) Application k la production d'une forme soluble de la S du SRAS-CoV. 
Purification de cet antigene recombinant et applications diagnostiques. 

La lign6e BHK-21 est la lign^e cellulaire qui s6crete les quantity les 
25 plus elevSes de polypeptide Ssol apres infection par le virus VV-TN-Ssol parmi les 
lignees testees (BHK-21, CV1, 293T et FrhK-4, figure 36B) ; elle permet la 
production et la purification en quantity du polypeptide recombinant Ssol. Dans une 
experience type ou les conditions exp&imentales d' infection, de production et de 
purification ont ete optimises, les cellules BHK-21 sont ensemenc^es en milieu de 
30 culture standard (DMEM sans pyruvate contenant 4.5g/l de glucose et supplements 
par 5% de TPB, 5% de SVF, 100 U/ml de penicilline et 100 ng/ml de streptomycine) 
sous la forme d'une monocouche sous-confluente (10 millions de cellules pour chaque 
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100 cm 2 dans 25 ml de milieu). Apres 24h d'incubation k 37°C sous 5% de C0 2 , les 
cellules sont infectees k une M.O.I, de 0.03 et le milieu standard remplac6 par le 
milieu de secretion oil la quantity de SVF est abaissee a 0.5% et le TPB supprim6. Le 
surnageant de culture est pr61ev6 aprds 2,5 jours d'incubation k 35°C et sous 5% de 
5 CO2 et le virus de la vaccine inactive par addition de triton X-100 (0,1%). Apres 
filtration sur membrane de polyethersulfone (PES) de 0.1 \xm, le polypeptide 
recombinant Ssol est purifi6 par une chromatographic d'affinite sur matrice anti- 
FLAG avec Slution par une solution de peptide FLAG (DYKDDDDK) a 100 ng/ml en 
TBS (Tris 50mM pH 7.4, 1 50 mMNaCl). 

10 L'analyse par gel SDS a 8 % d'acrylamide colors au nitrate d' argent 

a mis en evidence un polypeptide majoritaire dont la masse molSculaire est d'environ 
1801cD et dont le degre de purete est superieur a 90% (figure 37).La concentration du 
polypeptide recombinant Ssol purifie a ete determinee par comparaison avec les 
marqueurs de masse mol^culaire et estimee a 24 ng/\xl. 

15 Cette preparation de polypeptide Ssol purifie permet de rSaliser une 

gamme etalon pour mesurer a Faide d'un test ELISA-capture les concentrations de 
Ssol presentes dans les surnageants de culture. Selon ce test, la lign6e BHK-21 secrete 
environ 1 fig/ml de polypeptide Ssol dans les conditions de production decrites plus 
haut. En outre, le schema de purification pr^sente permet de purifier de Pordre de 160 

20 \xg de polypeptide Ssol par litre de surnageant de culture. 

La r^activit^ en ELISA du polypeptide recombinant Ssol a et£ 
analysee vis-&-vis de scrums de patients atteints de SRAS. 

Les scrums de cas probables de SRAS testes ont ete choisis sur la 
base des r^sultats (positifs ou n6gatifs) d'analyse de leur r^activite specifique vis k vis 

25 des antigdnes natifs du SRAS-CoV par test d' immunofluorescence sur cellules 
VeroE6 infectees par le SRAS-CoV et/ou par test ELISA indirect en utilisant comme 
antig&ne un lysat de cellules VeroE6 infectees par le SRAS -Co V. Les scrums de ces 
patients sont identifies par un num£ro d'ordre du Centre National de Reference des 
Virus Influenzae ainsi que par les initiates du patient et le nombre de jours 6coul£s 

30 depuis le d6but des symptdmes. Tous les serums de cas probables (cf Tableau XVI) 
reconnaissent les antigenes natifs du SRAS-CoV a l'exception du s£rum 032552 du 
patient VTT, pour lequel T infection par le SRAS-CoV n'a pas pu etre confirmee par 
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RT-PCR realis6e sur prelSvements respiratoires des jours 3, 8 et 12. Un panel de 
serums t&noin a 6te utilise & titre de contr61e (scrums TV): il s'agit de scrums prelev^s 
en France avant l'epidemie de SRAS survenue en 2003. 



serum 


patient 


jour de prelevement 


033168 


JYK 


38 


033597 


JYK 


74 


032632 


NTM 


17 


032634 


THA 


15 


032541 


PHV 


10 


032542 


NIH 


17 


032552 


VTT 


8 


032633 


PTU 


16 



Des phases solides sensibilisees par le polypeptide recombinant Ssol 
ont 6te preparees par adsorption d'une solution de polypeptide Ssol purifte & 4 jig/ml 
en PBS dans les puits d'une plaque ELISA. Les plaques sont incubees une nuit h 4°C 

10 puis lav£es avec du tampon PBS-Tween (PBS, 0,1% Tween20). Aprds lavage en 
PBS-tween, les scrums a tester (100 ^1) sont dilues au 1/100 et 1/400 dans du tampon 
PBS-lait ecrem6-Tween (PBS, 3% lait ecr&n<§, 0,1% Tween) puis ajout<§s dans les 
puits de la plaque ELISA sensibilisee. Les plaques sont incubees lh a 37°C. Apr6s 3 
lavages avec du tampon PBS-Tween, le conjugu^ anti-IgG humaines marque k la 

15 peroxidase (ref NA933V, Amersham) dilu6 au 1/4000 dans du tampon PBS-lait 
ecr&n6-Tween est ajoutS puis les plaques sont incubees une heure h 37°C. Apres 6 
lavages avec du tampon PBS-Tween, le chromogene (TMB) et le substrat (H 2 0 2 ) sont 
ajout&s et les plaques sont incubees 10 minutes a l'abri de la lumiere. La reaction est 
arretee par ajout d'une solution 1M de H3PO4 puis Tabsorbance est mesurSe & 450 nm 

20 avec une reference a 620nm. 

Les tests ELISA (figure 38) d&nontrent que le polypeptide 
recombinant Ssol est reconnu sp^cifiquement par les anticorps seriques de patients 
atteints de SRAS prelevds en phase moyenne ou tardive de Tinfection <> 10 jours 
apr&s le d6but des symptfimes), alors qu'il n'est pas reconnu de fa9on significative par 

25 les anticorps seriques des sdrums t&noins de sujets non atteints de SRAS. 
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En conclusion, ces resultats d^montrent que le polypeptide 
recombinant Ssol peut etre purifie a partir du surnageant de cellules de mammiffcres 
infectees par le virus vaccine recombinant VV-TN-Ssol et etre utilise comme antigene 
pour la mise au point d ! un test ELISA de diagnostic s£rologique de 1'infection par le 
5 SRAS-CoV. 

5) Applications vaccinales 

L'immunog&iicite des virus vaccine recombinants a 6t6 etudiee chez 

la souris. 

Pour cela, des groupes de 7 souris BALB/c ont 6te immunises par 
10 voie i.v. a deux reprises a 4 semaines d'intervalle par 10 6 u.f.p. de virus vaccine 
recombinants VV-TG, W-TG-S, W-TG-Ssol, W-TN, W-TN-S et VV-TN-Ssol 
ainsi que, a titre de contrdle, VV-TG-HA qui dirige l'expression de I'h&nagglutinine 
de la souche A/PR/8/34 du virus de la grippe. Les scrums immuns ont 6t6 preleves 3 
semaines aprds chacune des immunisations (IS1, IS2). 
15 Les scrums immuns ont et£ analyses par pool pour chacun des 

groupes par ELISA indirect en utilisant un lysat de cellules VeroE6 infectees par le 
SRAS-CoV comme antigSne et a titre de contrdle, un lysat de cellules VeroE6 non 
infectees. Les titres (TI) en anticorps anti-SRAS-CoV sont calcules comme ^inverse 
de la dilution produisant une DO specifique de 0,5 apres revelation par un anticorps 
20 polyclonal anti-IgG(H+L) de souris couple a la peroxidase (NA931V, Amersham) et 
du TMB addition^ de H 2 0 2 (KPL). Cette analyse (figure 39A) montre que 
l'immunisation par le virus W-TG-S et W-TN-S induit chez la souris des la 
premidre immunisation des anticorps diriges contre la forme native de la proteine de 
spicule du SRAS-CoV presente dans le lysat de cellules VeroE6 infectees. Les 
25 reponses induites par le virus VV-TN-S sont plus elevees que celles induites par le 
virus W-TG-S apres la premidre (TI^740 et TI=270 respectivement) et la deuxieme 
(TI=O230 et TI=600 respectivement) immunisation. Le virus VV-TN-Ssol induit de 
forts titres d'anticorps anti-SRAS-CoV apr6s deux immunisations (TI=640), alors que 
le virus VV-TG-Ssol induit une rSponse k la limite de la detection (TI=40). 
30 Les serums immuns ont 6t6 analyses par pool pour chacun des 

groupes pour leur capacite k sSroneutraliser l'infectivite du SRAS-CoV. 4 points de 
seroneutralisation sur cellules FRhK-4 (100 TCID50 de SRAS-CoV) sont rcklisds 
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pour chacune des dilutions de raison 2 test6es k partir du 1/20. Le titre s£roneutralisant 
est calcule selon la methode de Reed et Munsch comme 1' inverse de la dilution 
neutralisant Pinfectivite de 2 cupules sur 4. Cette analyse montre que les anticorps 
induits chez la souris par les virus vaccine exprimant la proteine S ou le polypeptide 
5 Ssol sont neutralisants et que les virus k promoteurs synthetiques sont des 
immunogenes plus efficaces que les virus porteurs du promoteur 7.5K : les titres les 
plus eleves (640) sont observes apres 2 immunisations par le virus W-TN-S (figure 
39B). 

Le pouvoir protecteur des anticorps neutralisants induits chez la 
10 souris apres immunisation par les virus vaccine recombinants est evalu6 k l'aide d'une 

infection d'6preuve par le SRAS-CoV. 

6) Autres applications 

Des virus vaccine recombinants de troisi&ne generation sont 

construits en substituant les sequences sauvages des g£nes S et Ssol par des genes 
15 synthetiques optimises pour P expression en cellules de mammiferes, decrits ci-dessus. 

Ces virus vaccine recombinants sont susceptibles d'exprimer des quantites plus 

importantes des antigenes S et Ssol et done de presenter une immunogenicite accrue. 

Le virus vaccine recombinant W-TN-Ssol peut 6tre utilise pour la 

production en quantity et la purification de Pantigene Ssol en vue d'applications 
20 diagnostiques (serologie par ELISA) et vaccinales (vaccin sous-unitaire), 

Exemple 17 : Virus recombinant de la rougeole exprimant la proteine de spicule 

(S) du coronavirus associS au SRAS (SRAS-CoV). Applications vaccinales. 

1) Introduction 

Le vaccin rougeole (MV) induit chez Phomme une immunite 
25 protectrice de longue duree apres une seule injection (Hilleman, 2002, Vaccine, 20 : 
651-665). La protection conferee est tres robuste et repose sur Pinduction d'une 
reponse en anticorps et d'une rdponse cellulaire CD4 et CD8. Le genome du MV est 
tres stable et aucune reversion vers la virulence des souches vaccinales n'a jamais 6t6 
observee. Le virus de la rougeole appartient au genre des Morbillivirus de la famille 
30 des Paramyxoviridae ; e'est un virus enveloppe dont le genome est un ARN 
monocat^naire de polarity negative de 16kb (figure 40 A) et dont le cycle de 
replication exclusivement cytoplasmique exclut toute possibility d'integration dans le 
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genome de l'h6te. Le vaccin rougeole est ainsi Tun des vaccins vivants les plus 
efficaces et les plus stirs utilises dans la population humaine. L'£quipe de Fr6d6ric 
Tangy a d£veloppe r£cemment un vecteur d' expression sur la base de la souche 
Schwarz du virus de la rougeole, qui est la souche attenude la plus sure et la plus 
5 utilisSe chez Phomme comme vaccin contre la rougeole. Cette souche vaccinale peut 
etre isolde a partir d'un clone moteculaire infectieux en conservant son 
immunogenicite chez les primates ainsi que chez la souris susceptible a l'infection. 
Elle constitue, apres insertion d'unites de transcription suppl&nentaires, un vecteur 
pour l'expression de sequences h^terologues (Combredet, 2003, J. Virol. 77 : 11546- 

10 11554). En outre, un MV Schwarz recombinant exprimant la glycoprot&ne 
d'enveloppe du virus West Nile (WNV) induit une r£ponse en anticorps efficace et de 
longue dur6e qui protege la souris d'une infection d'6preuve letale par le WNV 
(Despres et al, 2004, J. Infect. Dis., sous presse). Toutes ces caracteristiques font de la 
souche attenuee Schwarz du virus de la rougeole un candidat vecteur extremement 

15 prometteur pour la construction de nouveaux vaccins vivants recombinants. 

Le but de cet exemple est d'£valuer la capacite de virus 
recombinants de la rougeole (MV) exprimant diffSrents antigenes du coronavirus 
associe au SRAS (SRAS-CoV) & constituer de nouveaux candidats vaccins contre le 
SRAS. 

20 Les inventeurs se sont intdresses a la prot&ne de spicule (S) du 

SRAS-CoV, qui permet d'induire apres immunisation genique chez 1' animal des 
anticorps neutralisants lMnfectivit6 du SRAS-CoV, ainsi qu'& une forme soluble et 
secr6t6e de cette proline, le polypeptide Ssol, qui est compost de l'ectodomaine (aa 
1-1 193) de la S fusionnd en son extremity C-ter a une etiquette FLAG (DYKDDDDK) 

25 via un linker BspEl codant pour le dipeptide SG. Ce polypeptide Ssol pr^sente une 
antigenicity similaire k celle de la proteine S et permet, apres injection k la souris sous 
la forme d'une proteine purifiee adjuvee en hydroxide d'aluminium, l'induction de 
titres elev£s d' anticorps neutralisants contre le SRAS-CoV. 

Les differentes formes du g6ne S ont 6t6 introduites sous la forme 

30 d'une unite de transcription supplementaire entre les genes P (phosphoprot£ine) et M 
(matrice) dans le cADN de la souche Schwarz du MV pr6c6demment decrite 
(Combredet, 2003, J. Virol. 77 : 11546-11554 ; Demande EP N° 02291551.6 du 20 
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juin 2002, et Demande EP n° 02291550.8 du 20 juin 2002). Apres avoir isote les virus 
recombinants MVSchw2-SARS-S et MVSchw2-SARS-Ssol et verifie leur capacity k 
exprimer Pantigene S du SRAS-CoV, leur capacity a induire chez la souris puis chez 
le singe une reponse immunitaire protectrice contre le SRAS est testae. 
5 2) Construction des virus recombinants 

Le plasmide pTM-MVSchw-ATU2 (figure 40B) contient un cADN 
infectieux correspondant k Pantig&iome de la souche vaccinale Schwarz du virus de la 
rougeole (MV) dans lequel une unite de transcription suppl&nentaire (ATU) a 6t6 
introduite entre les genes P (phosphoproteine) et M (matrice) (Combredet, 2003, 

10 Journal of Virology, 77 : 11546-11554). Des genomes recombinants MVSchw2- 
SARS-S et MVSchw2-SARS-Ssol du virus de la rougeole ont 6t6 construits par 
l'insertion des ORFs de la proteine S et du polypeptide Ssol au sein de Punite de 
transcription supplemental du vecteur MVSchw-ATU2. 

Pour cela, un fragment d'ADN contenant le cADN de la S du SRAS- 

15 CoV a 6t6 amplifte par PCR a Paide des oligonucleotides 5 '-ATACGTACGA 
CCATGTTTAT TTTCTTATTA TTTCTTACTC TCACT-3' et 5 ' - ATAGCGCGCT 
CATTATGTGT AATGTAATTT GACACCCTTG-3' en utilisant le plasmide 
pcDNA-S comme matrice puis insure dans le plasmide pCR®2.1-TOPO (Invitrogen) 
pour obtenir le plasmide pTOPO-S-MV. Les deux oligonucleotides utilises 

20 contiennent des sites de restriction BsiWl et BssHII, de fa9on a permettre l'insertion 
ult&ieure dans le vecteur rougeole, et ont 6t6 con9us de fafon a g&ierer une sequence 
de 3774 nt incluant les codons d'initiation et de terminaison, afin de respecter la r6gle 
des 6 qui stipule que la longueur du g6nome d'un virus rougeole doit etre divisible par 
6 (Calain & Roux, 1993, J. Virol., 67 : 4822-4830 ; Schneider et aL, 1997, Virology, 

25 227 : 314-322). L'insert a ete sequence a Paide d'un kit BigDye Terminator vl.l 
(Applied Biosystems) et d'un s^quenceur automatique ABI377. 

Afin d' exprimer une forme soluble et s6cretee de la S du SRAS- 
CoV, un plasmide contenant PADNc du polypeptide Ssol correspondant a 
Pectodomaine (aa 1-1 193) de la S du SRAS-CoV fusionne en son extr&nite C-ter k la 

30 sequence d'une etiquette FLAG (DYKDDDDK) via un linker BspEl codant pour le 
dipeptide SG a ensuite 6t6 obtenu. Pour cela, un fragment d'ADN a 6t6 amplifte k 
Paide des oligonucleotides 5'-CCATTTCAAC AATTTGGCCG-3 ' et 5'- 
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ATAGGATCCG CGCGC TCATT ATTTATCGTC GTCATCTTTA TAATC-3' a 
partir du plasmide pCDNA-Ssol puis ins6v6 dans le plasmide pTOPO-S-MV entre les 
sites Sail et BamHl pour obtenir le plasmide pTOPO-S-MV-SF. La sequence gen^ree 
est longue de 3618 nt entre les sites BsiWl et BssHII et respecte la rfegle des 6. 
5 L'insert a ete sequence comme indique ci-dessus. 

Les fragments BsiWl -BssHII contenant les ADNc de la proline S 
et du polypeptide Ssol ont ensuite ete excises par digestion des plasmides pTOPO-S- 
MV et pTOPO-S-MV-SF puis sous-clones entre les sites correspondants du plasmide 
pTM-MVSchw-ATU2 pour dormer les plasmides pTM-MVSchw2-SARS-S et pTM- 

10 MVSchw2-SARS-Ssol (figure 40B). Ces deux plasmides ont ete deposes a la 
C.N.C.M. le l er decembre 2004, sous les numeros 1-3326 et 1-3327, respectivement 

Les virus rougeole recombinants correspondants aux plasmides 
pTM-MVSchw2-SARS-S et pTM-MVSchw2-SARS-Ssol ont <§te obtenus par 
genetique inverse selon le systeme reposant sur Putilisation d'une lign^e cellulaire 

15 auxiliaire, decrit par Radecke et coll. (1995, Embo J., 14, : 5773-5784) et modifie par 
Parks et coll. (1999, J. Virol., 73 : 3560-3566). Brievernent, les cellules auxiliaires 
293-3-46 sont transferees selon la methode au phosphate de calcium par 5 jag des 
plasmides pTM-MVSchw2-SARS-S ou pTM-MVSchw2-SARS-Ssol et 0,02 jig du 
plasmide pEMC-La dirigeant Pexpression de la polymerase L du MV (don de M.A. 

20 Billeter). Apres une nuit d'incubation k 37°C, un choc thermique est realise pendant 2 
heures a 43 °C et les cellules transferees sont transferees sur une monocouche de 
cellules Vero. Pour chacun des deux plasmides, des syncytia sont apparus apres 2 a 3 
jours de co-culture et ont ete transfers successivement sur des monocouches de 
cellules Vero a 70% de confluence en boites de p£tri de 35 mm puis en flacons de 25 

25 et 75 cm 2 . Quand les syncytia ont atteint 80-90% de confluence, les cellules sont 
recup£rees k Paide d'un grattoir puis congel£es et decongel^es xme fois. Apr6s une 
centrifugation a basse vitesse, le surnageant contenant le virus est conserve en aliquot 
a -80°C. Les titres des virus recombinants MVSchw2-SARS-S et MVSchw2-SARS- 
Ssol ont ete determines par dilution limite sur cellules Vero et le titre en dose infectant 

30 50% des cupules (TCID 50 ) calcuie selon la methode de Karber. 
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3) Caracterisation des virus recombinants 

L' expression des transgenes codant la proline S et le polypeptide 
Ssol a 6t6 recherchee par western blot et immunofluorescence. 

Des monocouches de cellules Vero en flacons T-25 ont £te infectges 
5 k une multiplicity de 0,05 par differents passages des deux virus MVSchw2-SARS-S 
et MVSchw2-SARS-Ssol et le virus sauvage MWSchw k titre de controle. Quand les 
syncytia ont atteint 80 a 90% de confluence, des extraits cytoplasmiques ont 6te 
prepares dans un tampon d'extraction (150mMNaCl, 50 mM Tris-HCl pH 7,2, 1% 
triton-X-100, 0,1% SDS, 1% DOC) puis diluSs en tampon de d6pot selon Laemmli, 

10 separes sur un gel SDS a 8% de polyacrylamide et transfers sur une membrane de 
PVDF (BioRad). La detection de cette immunoempreinte (« western blot») a €t€ 
rSalisee a l'aide d'un serum polyclonal de lapin anti-S (immun-s6rum du lapin 
PI 1135 : cf exemple 4 ci-dessus) et d'anticorps polyclonaux d'ane diriges contre les 
IgG de lapin et couples k la peroxidase (NA934V, Amersham). Les anticorps fixes ont 

15 6t6 r6v£les par luminescence k Taide du kit ECL+ (Amersham) et de films 
d'autoradiographie Hyperfilm MP (Amersham). 

Des cellules Vero en monocouches sur lamelles de verre ont 6t6 
infect^es par les deux virus MVSchw2-SARS-S et MVSchw2-SARS-Ssol et le virus 
sauvage MWSchw a titre de controle k des multiplicity d'infection de 0,05. Quand les 

20 syncytia ont atteint 90 a 100% (virus MVSchw2-SARS-Ssol) ou 30 a 40% 
(MVSchw2-SARS-S,MWSchw) de confluence, les cellules ont 6t6 fixees dans une 
solution de PBS-PFA 4%, perm6abilis6es par une solution de PBS contenant 0,2% de 
triton puis marquees par des anticorps polyclonaux de lapins hyperimmunises par des 
virions purifies et inactives du SRAS-CoV et par un conjugu^ d'anticorps de chevre 

25 anti-IgG(H+L) de lapin couple au FITC (Jackson). 

Comme le montrent les figures 41 et 42, les virus recombinants 
MVSchw2-SARS-S et MVSchw2-SARS-Ssol dirigent 1'expression de la proline S et 
du polypeptide Ssol respectivement k des niveaux comparables a ceux que Ton peut 
observer 8h apres infection par le SRAS-CoV. L 9 expression de ces polypeptides est 

30 stable apr6s 3 passages des virus recombinants en culture cellulaire. Ces resultats 
d&nontrent que les virus rougeole recombinants sont bien porteurs des transgenes et 
permettent 1'expression de la glycoprot&ne du SRAS sous sa forme membranaire (S) 
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ou sous une forme soluble (Ssol). On s'attend k ce que le polypeptide Ssol soit s6cr£t6 
des cellules infectees par le virus MVSchw2-SARS-Ssol comme c'est le cas lorsque 
ce raeme polypeptide est exprime dans des cellules de mammiferes apres transfection 
transitoire des sequences correspondantes (cf exemple 1 1 ci-dessus). 
5 4) Applications 

Ayant montr<§ que les virus MVSchw2-SARS-S et MVSchw2- 
SARS-Ssol permettent r expression de la S du SRAS-CoV, leur capacite a induire une 
r^ponse immunitaire protectrice contre le SRAS-CoV chez la souris CD46 +A IFN- 
apR" 7 ", qui est susceptible a F infection par le MV, est 6valu6e. La rdponse en anticorps 

10 des souris immunises est 6valuee par test ELISA contre les antigenes natifs du 
SRAS-CoV et pour leur capacity a neutraliser l'infectivitS du SRAS-CoV in vitro, en 
utilisant les methodologies d^crites ci-dessus. Le pouvoir protecteur de la r^ponse sera 
evalue en mesurant la reduction de la charge virale pulmonaire 2 jours apres une 
infection d'6preuve non letale par le SRAS-CoV. 

15 Des virus rougeole recombinants de seconde g6n6ration sont 

construits en substituant les sequences sauvages des genes S et Sol par des genes 
synth&iques optimises pour l'expression en cellules de mammiferes, decrits a 
Texemple 15 ci-dessus. Ces virus rougeole recombinants sont susceptibles d'exprimer 
des quantites plus importantes des antigenes S et Ssol et done de presenter une 

20 immunogenic^ accrue.; 

Alternativement, les g6nes sauvages ou synthetiques codant pour la 
proline S ou le polypeptide Ssol peuvent etre inserts dans le vecteur rougeole 
MVSchw-ATU3 sous la forme d'une unite de transcription supptementaire localis^e 
entre les genes H et L, puis les virus recombinants produits et caracteris^s de fa9on 

25 similaire. Cette insertion est susceptible de g6n£rer des virus recombinants poss^dant 
des caract&istiques (multiplication du virus, niveau d' expression du transg&ie) 
difKrentes et possiblement une immunogenic^ amelioree par rapport k ceux obtenus 
apres insertion des transgenes entre les g&ies P et N. 

Le virus rougeole recombinant MVSchw2-SARS-Ssol peut etre 

30 utilis6 pour la production en quantity et la purification de l'antigene Ssol en vue 
duplications diagnostiques et vaccinates. 
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Exemple 18 : Autres applications li€es a la proline S 

a) Les vecteurs lentiviraux pennettant Texpression de la S ou de Ssol , 
(voire de fragments de la S) peuvent constituer un vaccin recombinant contre le 
SRAS-CoV, pour etre utilise en prophylaxie humaine et veterinaire. Afin de 

5 d&nontrer la faisabilit<£ d'un tel vaccin, l'immunogenicit6 des vecteurs lentiviraux 
recombinants TRIP-SD/SA-S-WPRE et TRIP~SD/SA-Ssol-WPRE est Studiee chez la 
souris. 

b) Des anticorps monocionaux sont produits a l'aide du polypeptide 
recombinant Ssol. D'aprSs les resultats pr6sent6s a l'exemple 14 ci-dessus, ces 

10 anticorps ou du moins la majorite Centre eux reconnaitront la forme native de la S du 
SRAS-CoV et seront susceptibles d' applications diagnostiques et/ou prophylactiques. 

c) Un test de s6rologie du SRAS est mis au point avec le polypeptide 
Ssol utilise comme antigene et la m&hodologie du double epitope. 



WO 2005/056584 



PCT/FR2004/003106 



127 



REVENDICATIONS 

1°) Souche isolee ou puriftee de coronavirus humain associe au 
syndrome respiratoire aigu severe, caracteriste en ce que son genome presente sous la 
5 forme d'ADN compl&nentaire un codon serine en position 23220-23222 du g£ne de la 
proteine S ou un codon glycine en position 25298-25300 du gene de FORF3, et un 
codon alanine en position 7918-7920 de PORFla ou un codon serine en position 
26857-26859 du g6ne de la proteine M, lesdites positions etant indiqu^es en reference 
a la sequence Genbank AY2741 19.3. 
10 2°) Souche isolee ou puriftee de coronavirus selon la revendication 

1, caract&isee en ce que 1' equivalent ADN de son genome presente une sequence 
correspondant a la sequence SEQ ID NO : 1. 

3°) Polynucleotide isole ou purifte, caract&is6 en ce que sa sequence 
est celle du genome de la souche isolee de coronavirus selon la revendication 1 ou la 
15 revendication 2. 

4°) Polynucleotide isole ou purifie selon la revendication 3, 
caracterisS en ce que sa sequence est la SEQ ID NO : 1 . 

5°) Paire d'amorces apte a amplifier un fragment de la sequence du 
genome d'un coronavirus associe au SRAS ou de son equivalent ADN, caracttrisee en 
20 ce qu'elle est s£lectionne dans le groupe constitut par : 

- la paire d'amorces n° 1 correspondant respectivement aux positions 
28507 a 28522 (amorce sens, SEQ ID NO : 60) et 28774 a 28759 (amorce anti-sens, 
SEQ ID NO : 61) de la sequence du polynucleotide selon la revendication 3 ou la 
revendication 4, 

25 - la paire d'amorces n° 2 correspondant respectivement aux positions 

28375 k 28390 (amorce sens, SEQ ID NO : 62) et 28702 k 28687 (amorce anti-sens, 
SEQ ID NO : 63) de la sequence du polynucleotide selon la revendication 3 ou la 
revendication 4, et 

- la paire d'amorces constitute des amorces SEQ ID Nos 55 et 56. 

30 6°) Sonde apte k d&ecter la presence du genome d'un coronavirus 

associe au SRAS ou d'un fragment de celui-ci, caracterisee en ce qu'elle est 
s61ectionn6e dans le groupe constitue par les fragments correspondant aux positions 
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suivantes de la sequence du polynucleotide selon la revendication 3 ou k la 
revendication 4: 28561 k 28586, 28588 a 28608, 28541 a 28563 et 28565 k 28589 
(SEQ ID NO : 64 a 67). 

7°) Vecteur de clonage et/ou d' expression recombinant, caract6ris6 

5 en ce qu'il comprend un insert de sequence SEQ ID NO :38 et qu'il est compris dans 
une souche bacterienne qui et qu'il a 6te deposee sous le n° 1-3048, le 5 juin 2003, 
aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur 
Roux, 75724 Paris Cedex 15. 

8°) Vecteur de clonage et/ou d' expression recombinant, caract6ris6 

10 en ce qu'il contient un fragment d'ADNc selection^ dans le groupe constitue par : 

- un fragment d'ADNc codant pour une fusion C-terminale de la 
proline N (SEQ ID NO : 37) avec une etiquette polyhistidine, et 

- un fragment d'ADNc codant pour une fusion N-terminale de la 
proline N (SEQ ID NO : 37) avec une etiquette polyhistidine. 

15 9°) Vecteur d' expression recombinant selon la revendication 8, 

caract6ris6 en ce qu'il est compris dans une souche bacterienne qui a et6 deposee sous 
le n° I- 3117, le 23 octobre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 

10°) Cellules modifiees par un vecteur selon l'une quelconque des 
20 revendications 73 k 92. 

11°) Hybridome produisant un anticorps monoclonal contre la 
proline N, caract&ise en ce qu'il est choisi parmi les hybridomes suivants : 

- i'hybridome produisant I'anticorps monoclonal 87, d6pos6 a la 
CNCM le l er decembre 2004 sous le numero 1-3328, 

25 - I'hybridome produisant I'anticorps monoclonal 86, d£pos6 a la 

CNCM le l er decembre 2004 sous le num6ro 1-3329, 

- Thybridome produisant l'anticorps monoclonal 57, depos6 k la 
CNCM le l er decembre 2004 sous le num6ro 1-3330, et 

- Thybridome produisant l'anticorps monoclonal 156, depos€ k la 
30 CNCM le l er decembre 2004 sous le numero 1-333 1 . 
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12°) Anticorps ou fragment d'anticorps polyclonal ou monoclonal 
dirige contre la proteine N, caracterise en ce qu'il est produit par un hybridome selon 
la revendication 11. 

13°) Puce ou filtre, caract6risee en ce qu'il comprend un anticorps 
5 ou un fragment d'anticorps selon la revendication 12. 

14°) Test d'immunocapture destine a detecter une infection par le 
coronavirus associe au SRAS, caracterise en ce qu'il utilise un anticorps monoclonal 
specifique de la nucteoproteine virale native (proline N). 

15°)Test d'immunocapture selon la revendication 14, caracterise en 
10 ce que l'anticorps utilise pour la capture de la nucleoproteine virale native est un 
anticorps monoclonal specifique de la region centrale et/ou d'un Epitope 
conformationneh 

16°) Test d'immunocapture selon la revendication 14 ou 15, 
caracteris6 en ce que l'anticorps utilise pour la capture de la proteine N est l'anticorps 
15 monoclonal Acm87, produit par l'hybridome depose a la CNCM le l er decembre 2004 
sous le numero 1-3328. 

17°) Test d'immunocapture selon la revendication 14 ou 15, 
caracterise en ce que l'anticorps utilise pour la capture de la proteine N est 1'anticorps 
monoclonal Acm86, produit par l'hybridome depose k la CNCM le l er decembre 2004 
20 sous le numero 1-3329. 

18°) Test d'immunocapture selon la revendication 14 ou 15, 
caracterise en ce que les anticorps monoclonaux Acm86 et Acm87 sont utilises pour la 
capture de la proteine N. 

19°) Test d'immunocapture selon l'une quelconque des 
25 revendications 14 & 18, caracterise en ce que l'anticorps utilise pour la revelation de la 
proteine N est l'anticorps monoclonal Acm57, produit par 1'hybridome depose a la 
CNCM le l er decembre 2004 sous le numero 1-3330, ledit anticorps etant conjugue a 
une molecule ou une particule reveiatrice. 

20°) Test d'immunocapture selon l'une quelconque des 
30 revendications 14 k 18, caracterise en ce qu'une combinaison des anticorps Acm57 et 
Acm87, conjugues a une molecule ou une particule reveiatrice, est utilisee pour la 
revelation de la proteine N. 



WO 2005/056584 



PCT7FR2004/003106 



130 

21°) Reactif de detection d'un coronavirus assocte au SRAS, 
caract£ris6 en ce qu'il est selectionne dans le groupe constitue par : 

(a) une paire d'amorces selon la revendication 5, ou une sonde selon 
la revendication 6, 

5 (b) un vecteur recombinant selon Tune quelconque des 

revendications 7 k 9 ou une cellule modifiSe selon la revendication 10, 

(c) une souche isol6e de coronavirus selon la revendication 1 ou la 
revendication 2 ou un polynucleotide selon Tune quelconque des revendications 3 et 
4, 

10 (d) un anticorps ou un fragment d' anticorps selon la revendication 

12, 

(e) une combinaison d'anticorps comprenant les anticorps 
monoclonaux Acm86 et/ou Acm87, et Tanticorps monoclonal Acm57; 

(f) une puce ou un filtre selon la revendication 13. 

15 22°) Utilisation d'un produit s61ectionn6 dans le groupe constitue 

par : une paire d'amorces selon la revendication 50, une sonde selon la revendication 
61, un vecteur recombinant selon Fune quelconque des revendications 7 a 913 k 22, 
une cellule modifitee selon la revendication 1023, une souche isol6e de coronavirus 
selon la revendication 1 ou la revendication 2, un polynucleotide selon la a 

20 revendication 3 ou la revendication ou 4, pour la preparation d'un reactif de detection 
et eventuellement de genotypage d'un coronavirus assocte au SRAS. 

23°) Mdthode de detection d'un coronavirus assocte au SRAS, k 
partir d'un echantillon biologique, laquelle methode est caracteris^e en ce qu'elle 
comprend au moins : 

25 (a) Pextraction d'acides nucleiques presents dans ledit echantillon 

biologique, 

(b) l'amplification d'un fragment de PORF-N par RT-PCR a l'aide 
d'un couple d' amorces selon la revendication 50, et 

(c) la detection par tout moyen approprie des produits 
30 d'amplification obtenus en (b). 

24°) Methode selon la revendication 23, caracterisee en ce que 
l'gtape (b) de detection est r^alisee k l'aide d'au moins une sonde correspondant aux 



WO 2005/056584 



PCT/FR2004/003106 



131 

positions 28561 a 28586, 28588 k 28608, 28541 a 28563 et 28565 a 28589 de la 
sequence du polynucleotide selon la revendication 3 ou la revendication 4. 

25°) Methode de detection d'une infection par un coronavirus 
associe au SRAS, a partir d'un echantillon biologique, par ELISA IgG indirect 
5 utilisant la proteine N, laquelle methode est caract6ris6e en ce que les plaques sont 
sensibilis^es par une solution de proline N a une concentration comprise entre 0,5 et 
4jag/mL, de preference 2p,g/mL, dans un tampon PBS lOmM pH 7,2, rouge de phenol 
a 0,25mL /L. 

26°) Methode de detection d'une infection par un coronavirus 
10 associe au SRAS, a partir d'un echantillon biologique, par ELISA double Epitope, 
caracterisee en ce que le serum & tester est melange & TantigSne de revelation, ledit 
melange etant ensuite mis au contact de l'antig£ne fixe sur un support solide. 

27°) Complexe immun forme d'un anticorps ou d f un fragment 
d'anticorps polyclonal ou monoclonal selon la revendication 11, et d'une proteine ou 
15 d'un peptide du coronavirus associe au SRAS. 

28°) Kit ou coffret de detection d'un coronavirus associe au SRAS, 
caracterise en ce qu'il comprend au moins un reactif seiectionne dans le groupe 
constitue par : une paire d'amorces selon la revendication 5, une sonde selon la 
revendication 6, un vecteur recombinant selon Tune quelconque des revendications 7 
20 a 9, une cellule modifiee selon la revendication 10, une souche isoiee de coronavirus 
selon la revendication 1 ou la revendication 2 et un polynucleotide selon la 
revendication 3 ou la revendication 4. 

29°) Fragment du polynucleotide selon la revendication 3, 
caracterise en ce qu'il inclut au moins un couple de bases ou de paires de bases 
25 correspondant aux positions suivantes : 7919 et 23220, 7919 et 25298, 16622 et 
23220, 19064 et 23220, 16622 et 25298, 19064 et 25298, 23220 et 24872, 23220 et 
26857, 24872 et 25298, 25298 et 26857. 
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>< 



>< 



>< 
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ATATTAGGTT TTTACCTACC 
10 20 



>< ScrFI 

>< Mval 

EcoRII 

>< Ecll36I 

DsaV 

>< BstOI 

>< BstNI 

>< BsiLI 

BsaJI 

>< Apyl 



< TthHB8I 

< TaqI 

X Sau3AI 
>< Ndell 
>< MboIX 
>< DpnII 

>< Dpnl 
>< BspAI 



>< XhoII 
>< Sau3AI 
>< Ndell 
>< Mfll 
>< Mbol 
>< DpnII 
MnllX Dpnl 
X BstYI 
X BspAI 

X Bspl43I 



>< Bspl43IX Bglll 



CAGGAAAAGC CAACCAACCT CGATCTCTTG TAGATCTGTT CTCTAAACGA 



30 



40 



50 



60 



70 



>< Vnel 
X SphI 

>< Snol 
>< Rmal 
x Pael x Sdul 
X Nspl x NspII 
X NspHI >< HgiAI 
>< Nlalll x Bspl286I 
x Mael X Bmyl 
>< Tru9I >< ApaLI 

X Msel X Bbvl >< Alw44I 

>< Dral X Alul > < Fnu4HI X Alw21I 

ACTTTAAAAT CTGTGTAGCT GTCGCTCGGC TGCATGCCTA GTGCACCTAC GCAGTATAAA CAATAATAAA 
80 90 100 110 120 130 140 



X Sfcl 

X PstI 
X Mnll 
>< Ksp632I 

>< Hindll > < MboII x Earl 

>< Hindi >< Maelll X Eamll04I 

TTTTACTGTC GTTGACAAGA AACGAGTAAC TCGTCCCTCT TCTGCAGACT GCTTACGGTT TCGTCCGTGT 



150 



160 



170 



180 



190 



200 



210 



X TthHB8 I 
X TaqI 
>< Sau3AI 
X Ndell 
x Mbol 
X DpnII 

X Dpnl 
X BspAI 

X Bspl43I 



X Styl 
>< Rmal 
x Mael 
X EcoT14I 
Ecol30I 
BssTlI 
BsaJI 
Blnl 
Avrll 



X ScrFI 
X Neil 
>< Mspl 

X Maelll 
>< Hpall 
>< HapII 
x DsaV 
X Bcnl 

TGCAGTCGAT CATCAGCATA CCTAGGTTTC GTCCGGGTGT GACCGAAAGG TAAGATGGAG AGCCTTGTTC 
220 230 240 250 260 270 280 



X 
X 
X 
X 
X 



x Rmal 
>< Esp3I X Maell 
>< Hindll X MaeII> < Eco57I >< BsmAI x Mael 

X Hindi > < AflHI > < Ddel X Alw26I >< BsmBI 

TTGGTGTCAA CGAGAAAACA CACGTCCAAC TCAGTTTGCC TGTCCTTCAG GTTAGAGACG TGCTAGTGCG 
290 300 310 320 330 340 350 
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>< Sau96l 

>< PssI 
>< Pall 
>< NspIV 
>< Mnll 
>< Haelll 
>< Eco0109I 

>< Drallx MboII >< Pmll 
>< Cfrl3l >< PraaCl' 

>< BsuRI > < Maell 

>< BsiZIX EcoNI >< Eco72I 
>< BshI >< BslI >< BsaAI 
>< Plel >< Eamll04lx Asul >< BsiYIx BbrPI >< Mnll 

TGGCTTCGGG GACTCTGTGG AAGAGGCCCT ATCGGAGGCA CGTGAACACC TCAAAAATGG CACTTGTGGT 
360 370 380 390 400 410 420 



X Mnll 
X Ksp632I 
>< Hinfl 

x Earl 



X Tru9I 

X Rsal X SfaNI 

>< Rmal X Csp6I x BspWI >< Msel 

x Mael X Alul >< Afal X Alul > < Maell 

CTAGTAGAGC TGGAAAAAGG CGTACTGCCC CAGCTTGAAC AGCCCTATGT GTTCATTAAA CGTTCTGATG 
430 440 450 460 470 480 490 



>< Tru9I 
x Msel 
X Esp4I 
>< Aflll 



X Pall 
X Haelll 

>< Gdill 

>< Eael 
X BsuRI 
>< BshI 



X Alul 



>< Rsal 
Mcrl >< 
>< Csp6I 
>< BsmI BsiEI X 
X BscCI X Afal 



CCTTAAGCAC CAATCACGGC CACAAGGTCG TTGAGCTGGT TGCAGAAATG GACGGCATTC AGTACGGTCG 
500 510 520 530 540 550 560 



X Nspl 
>< NspHI 
X Nlalll 

X BslI X MboII 

X BsiYI X MboII 

X Acil >< Afal x AflHI X Muni X Acil 

TAGCGGTATA ACACTGGGAG TACTCGTGCC ACATGTGGGC GAAACCCCAA TTGCATACCG CAATGTTCTT 
570 580 590 600 610 620 630 



X Seal 
x Rsal 
> < Csp6I 
>< BsrI 

>< Afal 



X TthHB8 I 
X TaqI 
>< Sau3AI 
>< Ndell 
x Mbol 
>< DpnII 
> < Dpnl 
X Clal 
X BsulSI 
X BspDI 

X NlalV X BspAI 

X Mspl > < Bspl43I 

>< Hpall X Bspl06I 

x HapII >< BsiXI Maelll > 

x CfrlOI x Bsclx SfaNI Ddel >< 

X BscBI >< Alul >< Banlll Bfrl >< 

CTTCGTAAGA ACGGTAATAA GGGAGCCGGT GGTCATAGCT ATGGCATCGA TCTAAAGTCT TATGACTTAG 
640 650 660 670 680 690 700 
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>< Sau3AI 
>< Ndell 
>< Mbol 

>< HphI Vnel >< 

>< DpnII Snol >< 

X BspAI > < Nlalll 

>< AlwIX Dpnl >< Ddel ApaLI >< 

>< Alul >< Bspl43I >< MboII >< BsrI Alw44I >< 

GTGACGAGCT TGGCACTGAT CCCATTGAAG ATTATGAACA AAACTGGAAC ACTAAGCATG GCAGTGGTGC 



710 



720 



730 



740 



750 



760 



770 



>< Sdul 
>< NspII 
>< HgiAI 

>< Dralll 
>< Bspl286I 
>< Bmyl 
>< Alw21I 



>< SstI 
>< Sdul 
>< Sad 
>< NspII 

>< Mnll 
>< HgiAI 
>< Eco24I 

>< Ecll36II 
>< Bspl286I 
>< Bmyl 
>< Banll 
>< Alw21I 

>< Alul 



>< Maelll 



>< TthHB8I 
>< TaqI 

< Sail 

< Rtrl 

>< Hindll 
X Hindi 
>< Bsgl 
>< Accl 



Sau961 >< 
Pall >< 
NspIV >< 
Haelll >< 
Cfrl3I >< 
BsuRI >< 
BsiZI >< 
BshI >< 
Asul >< 



ACTCCGTGAA CTCACTCGTG AGCTCAATGG AGGTGCAGTC ACTCGCTATG TCGACAACAA TTTCTGTGGC 



780 



790 



800 



810 



820 



830 



840 



< 
< 



>< Thai 
>< Thai 

>< Mvnl 
>< Mvnl 

> < Rsal >< HinPlI 

> < NlalV >< Hin6I 

>< Kpnl >< Hhal 

>< Eco64I >< Cfol 

X Csp6I X BstUI 

> < BscBI X BstUI 
>< BanI >< BspSOI 
x Asp718 X BspSOI 

> < Afal >< Acil 
X AccBlI >< AccII 
x Acc65I X Mnll x SfaNI >< AccII 

CCAGATGGGT ACCCTCTTGA TTGCATCAAA GATTTTCTCG CACGCGCGGG CAAGTCAATG TGCACTCTTT 
850 860 870 880 890 900 910 



Vnel 
Snol 
>< Sdul 
NspII X 
HgiAI >< 
Bspl286I x 

X Bmyl 

> < ApaLI 

> < Alw44I 
Alw21I >< 



>< TthHB8 I 
X TthHB8I 

>< TaqI 
>< TaqI 

X Mnll 

x Ksp632I Nlalll >< 

X Hinfix Plel >< Nlalll 

X Eamll04I X MboII >< Maelll EcoRII >< 

X Earl > < Bbvix Accl >< Fnu4HI DsaV x 

CCGAACAACT TGATTACATC GAGTCGAAGA GAGGTGTCTA CTGCTGCCGT GACCATGAGC ATGAAATTGC 
920 930 940 950 960 970 980 



x ScrFI 



>< HinPlI 



X TthHB8 I 

X TaqI 

X Sful 

>< NspVX Tru9I 

>< Lsplx Msel . 
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>< Mval >< Hin6I >< sdul >< Csp45I 

>< Ecll36I >< Hhal >< NspII >< BstBI 

>< BstOI >< Haell >< HgiAI >< Bspll9I 

>< BstNI >< Eco47III >< Bspl286I >< BsiCI 

>< BsiLI >< Cfol >< Bmyl X Bpul4I 

>< Apyl >< Ddel >< Bspl4 3II >< Alul >< Alw21I X AsuII 

CTGGTTCACT GAGCGCTCTG ATAAGAGCTA CGAGCACCAG ACACCCTTCG AAATTAAGAG TGCCAAGAAA 

990 1000 1010 1020 1030 1040 1050 

>< Tru9I 
>< BsmI >< MseT 

>< BscCI > < Mnll 

TTTGACACTT TCAAAGGGGA ATGCCCAAAG TTTGTGTTTC CTCTTAACTC AAAAGTCAAA GTCATTCAAC 
1060 1070 1080 1090 1100 1110 1120 

X Pttill 
>< PmaCI 
>< Maell 
>< Eco72I 

>< BsaAI >< Nlalll >< Rsal 

>< BbrPI >< Bstll07I >< Csp6I 

>< AflHI >< Mnlix Ddel >< AccI X Afal 

CACGTGTTGA AAAGAAAAAG ACTGAGGGTT TCATGGGGCG TATACGCTCT GTGTACCCTG TTGCATCTCC 
1130 1140 1150 1160 1170 1180 1190 

x SfaNI 

x Maeiri >< AccI Nlalll x 

ACAGGAGTGT AACAATATGC ACTTGTCTAC CTTGATGAAA TGTAATCATT GCGATGAAGT TTCATGGCAG 

1200 1210 1220 1230 1240 1250 1260 

x SinI 
X Sau96I 
PssI x 

x PspSII 
>< PpuMI 
X NspIV 

X NspHU 
X Eco47I 
X Drall 
X Cfrl3I 
X BsiZI 
>< Brael8I 
X Avail 
X Asul 

>< Maell EcoO109l XAflHI > 

ACGTGCGACT TTCTGAAAGC CACTTGTGAA CATTGTGGCA CTGAAAATTT AGTTATTGAA GGACCTACTA 
1270 1280 1290 1300 1310 1320 1330 

Van91I X 

SinI >< 

x Rsal Sau96I >< 

X Nspl PflMI X 

X NlalV NspIV X 

X Nlalll NspHII > 

>< NspHlx Kpnl Eco47I X 

X Eco64I Cfrl3I >< 

>< Csp6I BslI X 

X BscBI BsiZI X 

>< BanI BsiYI x 

>< Asp718 Bmel8I X 

X Afal Avail X 

X AccBlI Asul X 

FIGURE 13. 4 
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X Acc65I >< Sfcl >< Nlalll AccB7I >< 

CATGTGGGTA CCTACCTACT AATGCTGTAG TGAAAATGCC ATGTCCTGCC TGTCAAGACC C AG AG AT T GG 
1340 1350 1360 1370 1380 1390 1400 

>< TthHB8I 
>< TaqlX Mnll 
>< Hinfl 

>< Ddel >< PleI >< AciI 

ACCTGAGCAT AGTGTTGCAG ATTATCACAA CCACTCAAAC ATTGAAACTC GACTCCGCAA GGGAGGTAGG 
1410 1420 1430 1440 1450 1460 1470 

>< Rmal NlalV >< 

X Mnll >< BsrI 

X Mael X Bbvl >< Fnu4HI BscBI X 

ACTAGATGTT TTGGAGGCTG TGTGTTTGCC TATGTTGGCT GCTATAATAA GCGTGCCTAC TGGGTTCCTC 

1480 1490 1500* 1510 1520 1530 1540 



X Maelll 
X Pall >< Eco31I 

x Haelll >< BsrI >< 

X BsuRI X BsrI >< BsmAI 

> < Ddel >< BspWI >< BsalX HphI 

>< Bshix Bgll >< Alw26I 

GTGCTAGTGC TGATATTGGC TCAGGCCATA CTGGCATTAC TGGTGACAAT GTGGAGACCT TGAATGAGGA 
1550 1560 1570 1580 1590 1600 1610 



x Rmal 

x Mnll 
>< Mael 



XhoII >< 
Sau3AI >< 
Ndell >< 
Mfll X 
Mbol >< 
Dpnl I >< 
Mnll Dpnl > 
BstYI >< 
BspAI >< 
Bspl43I > 



> < Tru9I 

> < Msel 
X Maell >< Tru9I 

X Hpal > < Mnll 

X Hindll > < Ksp632I 

X PleI X Hindi > < Earl 

X Afllll >< Msel > < Eamll04I 
TCTCCTTGAG ATACTGAGTC GTGAACGTGT TAACATTAAC ATTGTTGGCG ATTTTCATTT GAATGAAGAG 

1620 1630 1640 1650 1660 1670 1680 



x Alwl 



x Hinfl 
X Ddel 



x MboII pieI >< 

X BstXI X -SfaNI > < Hinfl 

GTTGCCATCA TTTTGGCATC TTTCTCTGCT TCTACAAGTG CCTTTATTGA CACTATAAAG AGTCTTGATT 
1690 1700 1710 1720 1730 1740 1750 

X Styl 
x Maelll 

x EcoT14I 
X PleI >< Ecol30I 

X Maelll >< BssTlI 

X HinfIX AciI >< BsaJI 

ACAAGTCTTT CAAAACCATT GTTGAGTCCT GCGGTAACTA TAAAGTTACC AAGGGAAAGC CCGTAAAAGG 
1760 1770 



BslI X 
BsiYI >< 



1780 


1790 




1800 


1810 1820 


>< Sau3AI 




X 


Van91I 




X Ndell 




X 


Pf 1MI 




>< Mbol 




X 


Dralll 




>< Dpnl I 




X 


BslI 




X Dpnl X 


Tru9I 


X 


BsiYI 




X BspAI X 


Msel 




X Bbvl 


>< Mnll 


>< Bspl43I 




X 


AccB7I 


Fnu4HI X 
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TGCTTGGAAC ATTGGACAAC AGAGATCAGT TTTAACACCA CTGTGTGGTT TTCCCTCACA GGCTGCTGGT 
1830 1840 1850 1860 1870 1880 1890 

>< Thai 
>< SfaNI 
>< Mvnl 
X HinPlI 
>< HinPlI 

>< Hin6I 
>< Hin6I 

>< Hhal 
>< Sau3AI >< Hhal 

>< NdeH >< Cfol PvuII > 

X Mbol >< Cfol PspSI > 

>< DpnII >< BstUI NspBII > 

>< Dpnl >< BssHII HphI >< 

X BspAI >< BspSOI Fnu4HI >< 

>< Bspl4 3I >< AccII >< Fnu4HI >< Bbvl Alul > 

GTTATCAGAT CAATTTTTGC G CGC AC ACT T GATGCAGCAA ACCACTCAAT TCCTGATTTG CAAAGAGCAG 
1900 1910 1920 1930 1940 1950 1960 

>< TthHB8I 

>< Styl 
>< Ncol 
>< Hindll 
>< Hindi 
>< Hinll 

X EcoT14I 
>< Eco57l 
>< TaqlX Ecol30I 
x Sail >< Dsal 
>< Rtrl X BssTlI 
>< BsaHI 

X Bbillx Nlalll 
x Maelll >< Acyl >< Hgal 

X Bbvl >< Maell >< AccIX BsaJI HphI x 

CTGTCACCAT ACTTGATGGT ATTTCTGAAC AGTCATTACG TCTTGTCGAC GCCATGGTTT AT ACT T C AG A 
1970 1980 1990 2000 2010 2020 2030 

X Rsal 

x Ndel > < Csp6I 

x BspMI >< Maelll >< BsrI >< Afal >< Ddel 

CCTGCTCACC AACAGTGTCA TTATTATGGC ATATGTAACT GGTGGTCTTG TACAACAGAC TTCTCAGTGG 
2040 2050 2060 2070 2080 2090 2100 

X StuI 

X Pall 

>< Haelll 

X Ecol47I 
x Sdul >< Ddel 

X NspII >< BsuRI 

X Bspl28 6I >< BshI Ddel X 

>< Bmyl >< AatI > < Mnll Bfrl >< 

TTGTCTAATC TTTTGGGCAC TACTGTTGAA AAACTCAGGC CTATCTTTGA ATGGATTGAG GCGAAACTTA 
2110 2120 2130 2140 2150 2160 2170 

X Tfil 

>< Hinfl Tthllll >< 

X SfaNI >< Bsgl >< Fokl Aspl >< 

GTGCAGGAGT TGAATTTCTC AAGGATGCTT GGGAGATTCT CAAATTTCTC AT T AC AGGTG TTTTTGACAT 
2180 2190 2200 2210 2220 2230 2240 
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Tru9I >< 
Msel >< 
Hpal > 
Hindll > 

>< Eco57I Hindi > 

CGTCAAGGGT CAAATACAGG TTGCTTCAGA TAACATCAAG GATTGTGTAA AATGCTTCAT TGATGTTGTT 
2250 2260 2270 2280 2290 2300 2310 

>< Sau3AI 
>< Ndell 
>< Mbol 

> < Maelll >< Sau3AI 

>< Fbal >< Ndell 

>< DpnII >< DpnII 

>< Dpnl >< DpnIMboII >< 

>< BspAI >< HinPlI Ddel >< 

>< Bspl43I >< Hin6I >< Bspl43I 

>< TthHB8I >< BsiQI >< Hhal >< MboIBfrl >< 

>< TaqI >< Bell >< Cfol >< BspAI Bbsl >< 
AACAAGGCAC TCGAAATGTG CATTGATCAA GTCACTATCG CTGGCGCAAA GTTGCGATCA CTCAACTTAG 

2320 2330 2340 2350 2360 2370 2380 

>< PvuII 

>< Maell >< PspSI 

>< Bstll07I >< NspBII 

>< BsaAI Fnu4HI >< 
>< Bbvl > < Fnu4HI 

>< HphI >< DrdI >< AccI >< Alul 

GTGAAGTCTT CATCGCTCAA AGCAAGGGAC TTTACCGTCA GTGTATACGT GGCAAGGAGC AGCTGCAACT 
2390 2400 2410 2420 2430 2440 2450 

>< Tru9I 

>< NlalV 
>< Msel 

>< Mnll 

>< Esp4I >< Seal 

>< Eco64I >< Rsal 

>< BscBI >< NlalllMnll >< 

>< Nlalll >< BanI Mnll >< 

>< Aflll >< Tfil >< Csp6I 

>< Bbvl >< AccBlI >< Maelll >< Hinfl >< HphI >< Afal 
ACTCATGCCT CTTAAGGCAC CAAAAGAAGT AACCTTTCTT GAAGGTGATT CACATGACAC AGTACTTACC 

2460 2470 2480 2490 2500 2510 2520 

> < Xhol 

>< TthHB8 I 
>< TthHB8 IX TaqI 

> < Slal 

> < PaeR7I 

> < Nsp.HI 

>< HphI >< Hinll 

> < Eco88I 

> < Ccrl 

>< Esp3I >< BsaHI 

> < Bcol 

>< BsmAI >< Bbill 

> < Aval >< Hgal 
>< TaqI > < Ama87I>< BsmBI 

>< DdelX Mnll >< Alw26I >< Acyl >< Alul 

TCTGAGGAGG TTGTTCTCAA GAACGGTGAA CTCGAAGCAC TCGAGACGCC CGTTGATAGC TTCACAAATG 
2530 2540 2550 2560 2570 2580 2590 
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>< BsrI 
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>< Pall >< 

>< Haelll 

>< BsuRI 

>< BshI 



Nlalll 

>< Mnll 
>< Ddel 
>< Bfrl 



>< Tru9I 
>< Msel 



GAGCTATCGT TGGCACACCA GTCTGTGTAA ATGGCCTCAT GCTCTTAGAG AT T AAGG AC A AAGAACAATA 



2600 



2610 



2620 



2630 



2640 



2650 



2660 



>< Vnel 

Tru9I >< 
X Snol 

>< Sdul 
>< NspII 
Msel >< 
>< HgiAI 
Bspl286I XBslI >< 
BsiYI >< 
>< Bmyl 
>< ApaLI 
X Tru9I >< Alw44I 
>< BsrI >< Msel >< Alw21I 

CTGCGCATTG TCTCCTGGTT TACTGGCTAC AAACAATGTC TTTCGCTTAA AAGGGGGTGC ACCAAT T AAA 
2670 2680 2690 2700 2710 2720 2730 



>< MstI 
>< HinPlI 
>< Hin6I 
X Hhal 
>< Fspl 
>< Fdill 
>< Cfol 
X Avill 



>< ScrFI 
>< Mval 
X EcoRII 

X Ecll36I 
>< DsaV 
>< BstOI 
X BstNI 
x BsmAI 
x BsiLI 
>< Apyl 
x Alw26I 



x Tfil 

X Maelll >< MboII > < Maelll >< Hinfl Alul >< 

GGTGTAACCT TTGGAGAAGA TACTGTTTGG GAAGTTCAAG GTTACAAGAA TGTGAGAATC ACATTTGAGC 



2740 



2750 



2760 



2770 



2780 



2790 



2800 



>< Maeri 

>< Hindll 
>< Hindi 
x Afllll 



x 

X 



Tru9I 
Msel 



x Sdul 
>< NspII 
X HgiAI 
X Bspl286I 
X Bmyl 
X Alw21I 

>< AccI 



x Tfil 
> 
> 

>< Hinfl 



X Rsal 
X NlalV 
Maelll >< 
>< MspIX Kpnl 
>< Hpall 
X HapII 

> < Eco64I 
X Csp6I 
x BscBI 

< BanI 

< Asp718 
>< Afal 



> < AccBlI 

> < Acc65I 



TTGATGAACG TGTTGACAAA GTGCTTAATG AAAAGTGCTC TGTCTACACT GTTGAATCCG GTACCGAAGT 
2810 2820 2830 2840 2850 2860 2870 

X Sau3AI 
>< Ndell 
>< Mbol 
X DpnII 

X Nspl > < Dpnl 

X NspHI >< MboII X BspAI 

X Nlalll > < BsrI > < Bspl43I 

X Odel >< Mail >< AlwNI >< Bbsl >< AlwNI 

TACTGAGTTT GCATGTGTTG TAGCAGAGGC TGTTGTGAAG ACTTTACAAC CAGTTTCTGA TCTCCTTACC 
2880 2890 2900 2910 2920 2930 2940 



x Sau3AI 
>< Ndell 
X Mbol 
X DpnII 

X Dpnl 
X BspAI 
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>< Nlallix Bspl43I >< Alul >< SfaNI 

AACATGGGTA TTGATCTTGA TGAGTGGAGT GTAGCTACAT TCTACTTATT TGATGATGCT GGTGAAGAAA 
2950 2960 2970 2980 2990 3000 3010 



>< MboII >< Gsul 

>< BsaAI 

>< HphI X MaellX Bpml >< Mnll 

ACTTTTCATC ACGTATGTAT TGTTCCTTTT ACCCTCCAGA TGAGGAAGAA GAGGACGATG CAGAGTGTGA 
3020 3030 3040 3050 3060 3070 3080 



>< SfaNI 
>< Mnll 
>< Ksp632l 
>< Earl 
>< Earall04I 



>< Mnll 
> < MboII 
x MboII 



>< Fokl 
Eco31I >< 
>< MamI BsraAI >< 
>< BsiBI Bsal >< 
>< BsaBIAlw26I >< 



> < Rsal 
>< Rsal 
X Nlalll 

>< Mnll 

X Csp6I 
>< Csp6I 

>< MboII > < Afal 

>< MboII >< Afal 

GGAAGAAGAA ATT GATGAAA CCTGTGAACA TGAGTACGGT ACAGAGGATG ATTATCAAGG TCTCCCTCTG 
3090 3100 3110 3120 3130 3140 3150 

>< NlalVx Pvulix XmnI 
>< Eco64I >< PspSI >< TthHB8 I 
X Mnll X Ddel >< TaqI 

>< BscBlX NspBII X Mnll 
>< BanI >< Mnll 

>< AccBlI X Alul >< Asp700I 
GAATTTGGTG CCTCAGCTGA AACAGTTCGA GTTGAGGAAG AAGAAGAGGA AGACTGGCTG GATGATACTA 
3160 3170 3180 3190 3200 3210 3220 



X Mnll >< MboII 

X Ksp632I >< MboII >< MboII 

>< Earl >< BsrI 

>< Eamll04I X Mbollx Bbsl 



X Tru9I 

x Fokl >< Msel >< Eco57I 

X Ddel >< BsrIX MboII BsrI X 

CTGAGCAATC AGAGATTGAG CCAGAACCAG AACCTACACC TGAAGAACCA GTTAATCAGT TTACTGGTTA 
3230 3240 3250 3260 3270 3280 3290 

>< Tru9I x Mnll 

>< Msel >< Tru9I >< HindllX Tru9I >< Dralll 

>< Dral >< Msel X HincIIX Msel >< BspWI 

TTTAAAACTT ACTGACAATG TTGCCATTAA ATGTGTTGAC ATCGTTAAGG AGGCACAAAG TGCTAATCCT 



3300 



3310 



3320 



3330 



3340 



3350 



3360 



< Nlalll 
X BspMI 



X Vnel 
X Snol 

> < 
> 
> 
> 
> 

X ApaLI 
X Alw4 4I 

> < Alw21I 



Sdul 
NspII 
HgiAI 
Bspl286I 
Bmyl 



X HphI 
>< Bbvl >< Fnu4HI 

ATGGTGATTG TAAATGCTGC TAACATACAC CTGAAACATG GTGGTGGTGT AGCAGGTGCA CTCAACAAGG 
3370 3380 3390 3400 3410 3420 3430 

x Sau96I 
>< Pall 

x NspIV 
>< Haelll 

>< NlalV >< Cfrl3I 



FIGURE 13.9 
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>< BsuRI 

> < Tru9I >< BsiZI 

> < Msel >< BshI >< Mnll 
>< Alul >< Asul >< Mnll 



CAACCAATGG TGCCATGCAA AAGGAGAGTG ATGATTACAT TAAGCTAAAT GGCCCTCTTA CAGTAGGAGG 
3440 3450 3460 3470 3480 3490 3500 



>< SinI 
>< Sau96I 
>< NspIV 
>< NspHlX NspHII 
>< Eco47I 
>< Cfrl3I 
>< Nlalll >< BspMI 
>< BsiZI 
>< Brael8I 
>< Avail Mnll >< 
> < Ddel >< Nsplx Asul Fokl X 

GTCTTGTTTG CTTTCTGGAC ATAATCTTGC TAAGAAGTGT CTGCATGTTG TTGGACCTAA CCTAAATGCA 
3510 3520 3530 3540 3550 3560 3570 

> < Tru9I 
X Hphl> < Msel 
X Esp4I 
>< Alul > < Ndel 

X Afllix Fnu4HI X Bbvl 
GGTGAGGACA TCCAGCTTCT TAAGGCAGCA TATGAAAATT TCAATTCACA GGACATCTTA CTTGCACCAT 
3580 3590 3600 36L0 3620 3630 3640 

Rsal x 
Csp6I X 

>< Eco57I >< Bcgl Afal >< 

TGTTGTCAGC AGGC AT AT T T GGTGCTAAAC CACTTCAGTC TTTACAAGTG TGCGTGCAGA CGGTTCGTAC 
3650 3660 3670 3680 3690 3700 3710 

>< Bsgl >< BspMI 

x Bcgl/a >< Alul x Nlalll 

ACAGGTTTAT ATTGCAGTCA ATGACAAAGC TCTTTATGAG CAGGTTGTCA TGGATTATCT TGATAACCTG 
3720 3730 3740 3750 3760 3770 3780 



>< Mnll 

>< Rmal > < Mnll >< NlalV x Tfil x MboII 

>< Mael x Eco57I x BscBI x Hinfl >< Ddel 

AAGCCTAGAG TGGAAGCACC TAAACAAGAG GAGCCACCAA ACACAGAAGA TTCCAAAACT GAGGAGAAAT 



3790 



3800 



3810 



3820 



3830 



3840 



3850 



X Tru9I 

X StuI 
>< Pall 
>< Msel >< Mnll >< 
>< Haelll >< 
X Ecol47I x 
X Rsal >< BsuRI 

X Csp6I x TthHB8I X BshI >< 

>< Afal x TaqI X AatI x 

CTGTCGTACA GAAGCCTGTC GATGTGAAGC CAAAAATTAA GGCCTGCATT GATGAGGTTA CCACAACACT 
3860 3870 3880 3890 3900 3910 3920 



Maelll 

Eco0651 

Eco91I 

BstXI X 
BstPI 
BstEII 



>< Ddel 



>< EcoRV 



Tfil X 
Nlalll X 
Hinfl >< 
X Hindlll 
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>< BsrI >< MboII >< Maelll >< Eco32I >< Alul 

GGAAGAAACT AAGTTTCTTA CCAATAAGT T ACTCTTGTTT GCTGATATCA ATGGTAAGCT TTACCATGAT 
3930 3940 3950 3960 3970 3980 3990 



>< Nspl 
>< NspHI 
>< Nlalll 
>< Mnll 

>< Ddel 
>< Ddel >< Bfrl 



>< SfaNI 

> < EcoNI 
>< MboII >< BslI 
>< HphI >< BsiYI 



> < Nlalll 
>< Fokl 



TCTCAGAACA TGCTTAGAGG TGAAGATATG TCTTTCCTTG AGAAGGATGC ACCTTACATG GTAGGTGATG 
4000 4010 4020 4030 4040 4050 4060 

>< Spel 
>< Rmal 

>< Mael >< EcoRVX HphI >< SfaNI 

>< HphI >< Eco32I >< Mnll >< Ddel 

TTATCACTAG TGGTGATATC ACTTGTGTTG TAATACCCTC CAAAAAGGCT GGTGGCACTA CTGAGATGCT 
4070 4080 4090 4100 4110 4120 4130 



>< ScrFI 
>< Rsal 

>< Mval 
>< EcoRII 

>< Ecll36I 
>< DsaV 
>< Csp6I >< EcoNI 
>< BstOI 
X BstNI 
>< BsiLI 
>< BsaJI 
>< BsaAI >< BslI 
>< MboII >< MaellX Apyl 

X Alul >< BsrI >< Afal X BsiYI 

CTCAAGAGCT TTGAAGAAAG TGCCAGTTGA TGAGTATATA ACCACGTACC CTGGACAAGG ATGTGCTGGT 
4140 4150 4160 4170 4180 4190 4200 



X Tru9I 
>< Msel 

>< Ddel >< Esp4I >< Rsal 

>< Mnll X BspWI >< Csp6I 

X Fokl x Alul X Aflll >< Eco57I X Afal 

TATACACTTG AGGAAGCTAA GACTGCTCTT AAGAAATGCA AATCTGCATT TTATGTACTA CCTTCAGAAG 



4210 



4220 



4230 



4240 



4250 



4260 



4270 



X ScrFI 
X Mval 
>< EcoRII 

>< Ecll36I 
X DsaV 
X BstOI 
>< BstNI 
X BsiLI 
X Apyl 

. CACCT AATGC TAAGGAAGAG ATTCTAGGAA CTGTATCCTG GAATTTGAGA GAAATGCTTG CTCATGCTGA 
4280 4290 4300 4310 4320 4330 4340 



> 
> 
> 
> 



X 
Ksp632I 
Earl > 
Eamll04I 
Ddel > 



Xmnl 

X Rmal 

< Tfiix MboII 

>< Mael 

< Hinfl 



x BspWI 



X Asp700I 



Nlalll X 
Ksp632I X 

>< Earl 
Eamll04I >< 

BsmAI X 
Alw2 6I X 



X Vspl 
>< Tru9I 
X Msel 
>< MboII 

X Eco57I 



X Zsp2I 
X PpulOI 

X Nsil 

>< Nlalll 
X Mphll03I 



x Fokl 
X Fokl 
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>< Asnl >< EcoT22I >< BspWI 

>< Asel >< Avalll >< Bgll >< Maell 

AGAGACAAGA AAATTAATGC CTATATGCAT GGATGTTAGA GCCATAATGG CAACCATCCA ACGTAAGTAT 
4350 4360 4370 4380 4390 4400 4410 

>< SfaNI 

>< Tru9I > < Hindll >< Tfil >< Spel 

><■ Msel > < HincIIX MboII >< Rntal 

>< Mnll >< DrdI >< Hinfl >< Mael 

AAAGGAATTA AAATTCAAGA GGG CATCGTT GACTATGGTG TCCGATTCTT CTTTTATACT AGTAAAGAGC 
4420 4430 4440 4450 4460 4470 4480 



>< Maelll 

X Sfcl >< Fnu4HI >< Muni 

>< Alul >< Alul >< Acil Maelll >< 

CTGTAGCTTC TATTATTACG AAGCT GAACT CTCTAAATGA GCCGCTTGTC ACAATGCCAA TTGGTTATGT 



4490 



4500 



4510 



4520 



4530 



4540 



4550 



>< Thai 
>< Mvnl 

>< MboII 
>< HinPlI 
X HinPlI 

>< Hin6I 
>< Hin6I 

>< Hhal 
>< Hhal 
>< Fnu4HI 

>< Cfol 
>< Cfol 
>< BstUI 
>< BssHIIX BspWI >< Tru9I 
>< Bsp50I >< Msel 

>< AccII >< Alul HphI >< 

GACACATGGT TTTAATCTTG AAGAGGCTGC GCGCTGTATG CGTTCTCTTA AAGCTCCTGC CGTAGTGTCA 
4560 4570 4580 4590 4600 4610 4620 



>< Tru9I 
>< Nlalll 

>< Msel 

>< Mnll 
>< Ksp632I 
>< Earl 
>< Eamll04I 
>< Bbvl 



X Maelll 

>< SfaNI X AlwNI >< Mnll >< Mniix Ddel 

GT AT CATC AC CAGATGCTGT TACTACATAT AATGGATACC TCACTTCGTC ATCAAAGACA TCTGAGGAGC 



4630 



4640 



4650 



4660 



4670 



4680 



4690 



X Sdul 
X NspII 
X HgiAI 
>< Bspl286I 
>< Bmyl 
X Alw21I 



X SinI 
X Sau96I 
X NspIV 

X NspHU 
X Eco47I 
X Cfrl3I 
X BsiZI 
X Bmel8I 
X Avail 
x Asul 



>< Rsal 
>< Csp6I 
>< Afal 



ACTTTGTAGA AACAGTTTCT TTGGCTGGCT CTTACAGAGA TTGGTCCTAT TCAGGACAGC GTACAGAGTT 



4700 



4710 



4720 



4730 



4740 



4750 



4760 



X Tru9I 
X Msel 
X Esp4I 



X Rsal 
X HphI 
X Csp6I 

FIGURE 13.12 



x Van91I 
x PflMI 
x BslI 
X BsiYI 



> < TthHB8I 

> < TaqI 
x Sdul 

X NspII • 

X Eco24I 

X Bspl286I 

>< Bmyl Gsul x 
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>< Aflll >< Maelll >< Afal >< AccB7I >< BanllBpml >< 

AGGTGTTGAA TTTCTTAAGC GTGGTGACAA AATTGTGTAC CACACTCTGG AGAGCCCCGT CGAGTTTCAT 
4770 4780 4790 4800 4810 4820 4830 

>< Tru9I 
>< Plel >< EcoNI 
>< Mnll >< BslI 
>< BsmAI >< BsiYI 
>< Mnll >< HphI >< HinflX Alw26I>< Acil >< Msel 

CTTGACGGTG AGGTTCTTTC ACT TG AC AAA CTAAAGAGTC TCTTATCCCT GCGGGAGGTT AAGACTATAA 
4840 4850 4860 4870 4880 4890 4900 

>< Alul >< Ndel 

AAGTGTTCAC AACTGTGGAC AACACTAATC TCCACACACA GCTTGTGGAT ATGTCTATGA CATATGGACA 
4910 4920 4930 4940 4950 4960 4970 

>< SinI 
>< Sau96I 
>< NspIV 

>< NspHII 
X Eco47I 

X Cfrl3I Nlalll X 

>< BsiZI X Nlalll 

>< BmelSI > < Mnll 

>< Avail >< Maelll >< Tru9I X Mnll 

X Asul X Fokl X Msel x BspHI 

GCAGTTTGGT CCAACATACT TGGATGGTGC TGATGTTACA AAAATTAAAC CTCATGTAAA TCATGAGGGT 
4980 4990 5000 5010 5020 5030 5040 



X Rsal 
> 
> 

>< Csp6I 
>< Afal 



Rraal 
Mael 



> < TthHB8 I 

> < TaqI 

>< SnaBI. X Seal 

x Maell X Hindlll X Rsal 
>< Ecol05I x Csp6I 

X BsaAI >< Alul >< Afal 



AAGACTTTCT TTGTACTACC TAGTGATGAC ACACTACGTA GTGAAGCTTT CGAGTACTAC CATACTCTTG 



5050 



5060 



5070 



5080 



5090 



5100 



5110 



>< Rsal 

>< Nspl 
X NspHI 
X Nlalll 

> < Csp6I >< Tru9I Mnll > 

>< Afllll X Msel BslI X 

>< Afal >< Dral BsiYI X 

ATGAGAGTTT TCTTGGTAGG TACATGTCTG CTTTAAACCA CACAAAGAAA TGGAAATTTC CTCAAGTTGG 
5120 5130 5140 5150 5160 5170 5180 



>< Tru9I x Tru9I >< Rmal 

X Msel >< Msel X Muni >< Mael Alul > 

TGGTTTAACT TCAATTAAAT GGGCTGATAA CAATTGTTAT TTGTCTAGTG TTTTATTAGC ACTTCAACAG 



5190 



5200 



5210 



5220 



5230 



5240 



5250 



X Mnll 



X SfaNI 

X Sdul 

>< NspII 

>< Eco24I 

X Bspl286I 

>< Bmyl HphI 

X Bbvl Fnu4HI X 

>< Banll >< BspWI 
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CTTGAAGTCA AATTCAATGC ACCAGCACTT CAAGAGGCTT ATTATAGAGC CCGTGCTGGT GATGCTGCTA 
5260 5270 5280 5290 5300 5310 5320 

>< Vnel 
>< Snol 

>< Sdul 

>< NspII 

>< HgiAI 

>< Bspl286I 

X Bmyr 
>< ApaLI 

>< Alw44I MboII >< 

X Alw21I >< Alul >< HphI 

ACTTTTGTGC ACT C AT ACT C GCTTACAGTA ATAAAACTGT TGGCGAGCTT GGTGATGTCA GAGAAACTAT 
5330 5340 5350 5360 5370 5380 5390 

> < SphI 

> < Pael 

> < Nspl 

> < NspHI >< Tfil >< Tru9I 
>< Sfcl > < Nlallix Hinfl >< Msel 

GACCCATCTT CTACAGCATG CTAATTTGGA ATCTGCAAAG CGAGTTCTTA ATGTGGTGTG TAAACATTGT 
5400 5410 5420 5430 5440 5450 5460 

>< Rsal 

>< Tru9I > < Csp6I Esp4I > 

>< Msel >< Alul >< Afal Aflll > 

GGTCAGAAAA CTACTACCTT AACGGGTGTA GAAGCTGTGA TGTATATGGG TACTCTATCT TATGATAATC 
5470 5480 5490 5500 5510 5520 5530 

>< Rsal 

>< MboII 
>< RmalHinfl >< 
>< Csp6I 

>< Tru9I >< SfaNI >< Mael >< Bbsl 

>< Msel >< Nlalll >< Afal 

TTAAGACAGG TGTTTCCATT CCATGTGTGT GTGGTCGTGA TGCTACACAA TATCTAGTAC AACAAGAGTC 
5540 5550 5560 5570 5580 5590 5600 

>< Rsal 

>< Plel > < Ddel >< Csp6I 

>< Bsgl >< BspWI X BspMI >< Afal 

TTCTTTTGTT ATGATGTCTG CACCACCTGC TGAGTATAAA TTACAGCAAG GTACATTCTT ATGTGCGAAT 
5610 5620 5630 5640 5650 5660 5670 

>< Eco31I 

>< Rsal >< Ddel 

> < Maelll >< BsmAI 

X Csp6I >< Bsal Mnll X 

X Afal X BsrI >< Alw26I HphI > 

GAGTACACTG GTAACTATCA GTGTGGTCAT TACACTCATA TAACTGCTAA GGAGACCCTC TATCGTATTG 

5680 5690 5700 5710 5720 5730 5740 

>< SstI >< SinI 

>< Sdul >< Sau96I 

X SacI >< NspIV 

X NspII >< NspHII 

>< HgiAI > < Rsal >< Maelll 

X Eco24I >< Eco47I 

x EC1136II >< Cfrl3I 

X Bspl286I >< BsiZI 

X Bmyl >< Brael8I 

FIGURE 13. 14 
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>< Banll >< Avail 

>< Alw21I X Csp6I>< Asul 

>< Alul > < Afal X Bsrix AlwNI 

ACGGAGCTCA CCTTACAAAG ATGTCAGAGT ACAAAGGACC AGTGACTGAT GTTTTCTACA AGGAAACATC 
5750 5760 5770 5780 5790 5800 5810 

>< TthHB8I 

>< TaqI >< Maelll 

TTACACTACA ACCATCAAGC CTGTGTCGTA TAAACTCGAT GGAGTTACTT ACACAGAGAT TGAACCAAAA 
5820 5830 5840 5850 5860 5870 5880 

>< Rsal 
>< Csp6I 
>< Sfcl >< Bbvl 
>< Fokl >< Fnu4HI >< Afal 

TTGGATGGGT ATTATAAAAA GGATAATGCT TACTATACAG AGCAGCCTAT AGACCTTGTA CCAACTCAAC 
5890 5900 5910 5920 5930 5940 5950 

Tru9I X 
Swal >< 
Msel X 

> < Nspl MamI >< 

> < NspHI Oral >< 

> < Nlalll BsiBI >< 
>< Afllll BsaBI >< 

CATTACCAAA TGCGAGTTTT GATAATTTCA AACTCACATG TTCTAACACA AAATTTGCTG ATG AT T T AAA 
5960 5970 5980 5990 6000 6010 6020 

X MboII 
>< Alul >< Aluix Maelll 

TCAAATGACA GGCTTCACAA AGCCAGCTTC ACGAGAGCTA TCTGTCACAT TCTTCCCAGA CTTGAATGGC 
6030 6040 6050 6060 6070 6080 6090 

>< Sfcl 

GATGTAGTGG CTATTGACTA TAGACACTAT TCAGCGAGTT TCAAGAAAGG TGCTAAATTA CTGCATAAGC 
6100 6110 6120 6130 6140 6150 6160 

>< Tru9X 

X ScrFI 
X Mval 
X Msel 

X EcoRII 

X EC1136I 
X DsaV 

X BstOI 

x BstNI Maell >< 

>< Muni >< BsiLI >< Dralll 

X BstXI >< Apyl >< Maell >< BstXI 

CAATTGTTTG GCACATTAAC CAGGCTACAA CCAAGACAAC GTTCAAACCA AACACTTGGT GTTTACGTTG 

6170 6180 6190 6200 6210 6220 6230 

> < Rsal 

X Csp6I MboII X 

> < Afalx BsrI >< Bbsl 
TCTTTGGAGT ACAAAGCCAG TAGATACTTC AAATTCATTT GAAGTTCTGG CAGTAGAAGA CACACAAGGA 

6240 6250 6260 6270 6280 6290 6300 

X Hindll >< MboII 

X Hindi >< Mnll >< Eco57I 

ATGGACAATC TTGCTTGTGA AAGTCAACAA CCCACCTCTG AAGAAGTAGT GGAAAATCCT ACCATACAGA 
6310 6320 6330 6340 6350 6360 6370 
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>< Maelll >< Tru9I 

>< Maell >< Msel 

AGGAAGTCAT AGAGTGTGAC GTGAAAACTA CCGAAGTTGT AGGCAATGTC ATACTTAAAC CATCAGATGA 
6380 6390 6400 6410 6420 6430 6440 



>< XhoII 
>< Sau3AI 
>< Nlalll 
>< Ndell 
>< Mfll 
>< Mbol 
>< DpnII 

>< Dpnl 
>< BstYI 

>< Tru9I >< BspAI 

>< Msel >< BspHI >< Bspl43lX Fnu4HI 

> < Maelll >< Mnll >< Bbvl >< Alwl 

AGGTGTTAAA GTAACACAAG AGTTAGGTCA TGAGGATCTT ATGGCTGCTT ATGTGGAAAA CACAAGCATT 
6450 6460 6470 6480 6490 6500 6510 



>< Saul 
>< Rmal 

>< Mstll 
>< Mae I 

>< Eco81I 

>< Ddel 

>< Cvnl 

>< Bsu36I 

>< Bse21I 

>< Bfrl> < Tru9I 

>< Tru9I >< Axyl> < Mseix Muni >< Nlalll 

X Msel >< Alul >< AocI >< Dral >< Bbvl Fnu4HI X 

ACCATTAAGA AACCTAATGA GCTTTCACTA GCCTTAGGTT TAAAAACAAT TGCCACTCAT GGTATTGCTG 
6520 6530 6540 6550 6560 6570 6580 



>< Vspl >< Styl 

>< Tru9I >< EcoT14I > < Ddel 

>< Msel >< Ecol30I >< BslI 

>< Asnl >< BssTlI >< BsiYI 

>< Asel >< BsaJI > < Bfrl >< Fnu4HI 

CAATTAATAG TGTTCCTTGG AGTAAAATTT TGGCTTATGT CAAACCATTC TTAGGACAAG CAGCAATTAC 

6590 6600 6610 6620 6630 6640 6650 



X HinPlI 

>< Hir\6I >< Tru9I 

>< Hhal >< Maelix Msel 

>< Ddel >< Drain 

X Bbvl X Cfol >< Afllll 
AACATCAAAT TGCGCTAAGA GATTAGCACA ACGTGTGTTT AACAATTATA TGCCTTATGT GTTTACATTA 

6660 6670 6680 6690 6700 6710 6720 



>< Rsal > < Rsalx Xbal 

>< Csp6I >< Csp6I >< Rmal 

X Muni X Afal > < Afal >< Mael X Alul 

TTGTTCCAAT TGTGTACTTT TACTAAAAGT ACCAATTCTA GAATTAGAGC TTCACTACCT ACAACTATTG 
6730 6740 6750 6760 6770 6780 6790 



X Vspl 
>< Tru9I 
x Nael 
>< Mspl 

>< Msel 
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>< Hpall 
>< HapH 
>< CfrlOI >< Fokl 
>< Tru9I >< Asnl 

>< Msel >< SfaNI >< Aselx HphlX Maelll 

CTAAAAATAG TGTTAAGAGT GTTGCTAAAT TATGTTTGGA TGCCGGCATT AATTATGTGA AGTCACCCAA 
6800 6810 6820 6830 6840 ■ 6850 6860 

x Tru9I >< Ddel Maelll > 

X Msel x Bfrl >< Bbvl 

ATTTTCTAAA TTGTTCACAA TCGCTATGTG GCTATTGTTG TTAAGTATTT GCTTAGGTTC TCTAATCTGT 

6870 6880 6890 6900 6910 6920 6930 

>< Sdul 
X NspII 
X HgiAI 

> < Rsal X Bspl286I 
>< Csp6I >< Bmyl 

>< Fnu4HI > < Afal x Alw21I 

GTAACTGCTG CTTTTGGTGT ACTCTTATCT AATTTTGGTG CTCCTTCTTA TTGTAATGGC GTTAGAGAAT 
6940 6950 6960 6970 6980 6990 7000 

Tru9I X 
Msel x 

x Tru9I > < Maelll x Fnu4HI 

>< Msel x Maell Bbvl > 

TGTATCTTAA TTCGTCTAAC GT TACT ACT A TGGATTTCTG TGAAGGTTCT TTTCCTTGCA GCATTTGTTT 
7010 7020 7030 7040 7050 7060 7070 

> < Tfil Rsal X 

X MamI X HphI 

. > < Hinf I Csp6I X 

X BsiBI X Xmnix Maelll Alul > 

>< Pleix Hinfl x BsaBI >< Alul x Asp700I Afal x 

AAGTGGATTA GACTCCCTTG ATTCTTATCC AGCTCTTGAA ACCATTCAGG TGACGATTTC ATCGTACAAG 
7080 7090 7100 7110 7120 7130 7140 

>< Pall 

X NspBII 
>< Haelll 
>< Gdill 

>< Fnu4HI 
>< Eael 

X Ddel 
X BsuRI 

X Rmal x Bshl >< BslI 

>< Mael >< Aciix BsiYI 

CTAGACTTGA CAATTTTAGG TCTGGCCGCT GAGTGGGTTT TGGCATATAT GTTGTTCACA AAATTCTTTT 
7150 7160 7170 7180 7190 7200 7210 



x BspMI >< Rmal 

x Alul >< Mael 

ATTTATTAGG TCTTTCAGCT ATAATGCAGG TGTTCTTTGG CTATTTTGCT AGTCATTTCA TCAGCAATTC 



7220 



7230 



7240 



7250 



7260 



7270 



7280 



> < Nlalll 



X NlalV 
X Eco64I 

> < Rsal X BscBI 
x Csp6I x BanI 

> < AfalX AccBlI 

FIGURE 13.17 



Rsal X 

X MboII 
MamI >< 
Csp6I X 
BsiBI >< 
BsaBI x 
Afal >< 
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TTGGCTCATG TGGTTTATCA TTAGTATTGT ACAAATGGCA CCCGTTTCTG CAATGGTTAG GATGTACATC 
7290 7300 7310 7320 7330 7340 7350 



>< Fokl 



TthHB8 I >< 

X 



TaqI 



>< Ndel 
>< Ksp632I 
>< Earl 

>< Eamll04I>< AluIX MboII 



>< 



Mnll 
Ksp632I >< 
>< Fokl 
X MboII Earl >< 
Nlalll Eamll04I x 



>< 



TTCTTTGCTT CTTTCTACTA CATATGGAAG AGCTATGTTC ATATCATGGA TGGTTGCACC TCTTCGACTT 



7360 



7370 



7380 



7390 



7400 



7410 



7420 



X Thai > < 

X Mvnl > < 

>< HinPlI X Mlul > < 
>< Hin6I X BstUI 

>< Hhal >< BspSOI >< Rsal 

X Nlalll >< Cfol >< Afllll X Csp6I . >< Tru9I 

X BspWI X BspWI X AccII >< Afal >< Msel 
GCATGATGTG CTATAAGCGC AATCGTGCCA CACGCGTTGA GTGTACAACT ATTGTTAATG GCATGAAGAG 

7430 7440 7450 7460 7470 7480 7490 



XhoII X 
Sau3AI >< 
Nlalll X 

Ndel I >< 
Mfll >< 
Mbol x 

> < ECsp632I 

> < Earl 

> < Eaiall04I 
DpnII X 
BstYI X 
BspAI >< 
Bglll X 



X Pall 
>< Haelll 

X Dsal >< Muni 

X MboII X BsuRI Maelll >< 

x Dpnl >< BshI >< Muni BsmAI >< 

x Bspl431 >< Mnll >< BsaJI >< Pleix Hinfl Alw26I X 

ATCTTTCTAT GTCTATGCAA ATGGAGGCCG TGGCTTCTGC AAGACTCACA ATTGGAATTG TCTCAATTGT 

7500 7510 7520 7530 7540 7550 7560 

X Rsal Tru9I >< 

> < Csp6I Msel >< 

X BsrI >< Gsul x MaelllDral >< 

>< Afal >< Bpml > < BsrI 

GACACATTTT GCACTGGTAG TACATTCATT AGTGATGAAG TTGCTCGTGA TTTGTCACTC CAGTTTAAAA 

7570 7580 7590 7600 7610 7620 7630 



X Thai 
X Mvnl 
> < HphI 
HinPlI x 

X HinPlI 

>< Hin6I 
X Hin6I 
Hhal X 

>< Hhal 
Cfol X 

X Cfol 
>< BstUI 
x BssHII 
BspSOI x 

> < BsrI >< AccII 

GACCAATCAA CCCTACTGAC CAGTCATCGT ATATTGTTGA TAGTGTTGCT GTGAAAAATG GCGCGCTTCA 
7640 7650 7660 7670 7680 7690 7700 

FIGURE 13. 18 
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>< Fokl 

>< BsmAI 

X Mnll >< Alw26I >< Acil 

CCTCTACTTT GACAAGGCTG GTCAAAAGAC CTATGAGAGA CATCCGCTCT CCCATTTTGT CAATTTAGAC 
7710 7720 7730 7740 7750 7760 7770 

X Vspl 
>< Tru9I 
X Msel 
>< Asnl 

> < Alul >< Asel >< Bcgl/a 

AATTTGAGAG CTAACAACAC TAAAGGTTCA CTGCCTATTA ATGTCATAGT TTTTGATGGC AAGTCCAAAT 
7780 7790 7800 7810 7820 7830 7840 



>< Sfcl 



>< PvuII 



>< Rsal >< Psp5I 

>< Plel >< Csp6l >< NspBII 

>< Hinfl >< Ddel >< Bcgl >< Afal >< Alul 

GCGACGAGTC TGCTTCTAAG TCTGCTTCTG TGTACTACAG TCAGCTGATG TGCCAACCTA TTCTGTTGCT 



7850 



7860 



7870 



7880 



7890 



7900 



7910 



TthHB8I >< 
TaqI >< 
Sail >< 
Rtrl >< 

X Seal Hindll > 

>< Rsal >< Tru9I Hindi > 

X Csp6I >< SfaNI X Eco57I 

X Alul >< Maell >< Afal >< Msel AccI >< 

TGACCAAGCT CTTGTATCAG ACGTTGGAGA TAGTACTGAA GTTTCCGTTA AGATGTTTGA TGCTTATGTC 
7920 7930 7940 7950 7960 7970 7980 

X Tru9I 
X Msel 

> < Esp4I X Sfcl 

> < Aflll >< BspWI X Alul 
GACACCTTTT CAGCAACTTT TAGTGTTCCT ATGGAAAAAC T T AAGGC ACT TGTTGCTACA GCTCACAGCG 

7990 8000 8010 8020 8030 8040 8050 

X PvuII 
X PspSI 
X NspBII 
X Fnu4HI 

X Alul >< Bbvl X Alul 

AGTTAGCAAA GGGTGTAGCT TTAGATGGTG TCCTTTCTAC ATTCGTGTCA GCTGCCCGAC AAGGTGTTGT 
8060 8070 8080 8090 8100 8110 8120 

Maelll >< 

>< Hindll >< BsmAI >< Ddel 

X Hindi >< FoklX Alw26I >< Bfrl 

TGATACCGAT GTTGACACAA AGGATGTTAT TGAATGTCTC AAACTTTCAC ATCACTCTGA CTTAGAAGTG 
8130 8140 8150 8160 8170 8180 8190 



>< XhoII 
Sau3AI >< 

>< Ndell 
x Mfll 
x Mbol 
>< Nlalll >< Hgal 
>< Hinll >< DpnII 
Dpnl x 
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Bspl43I >< 
X BsaHI >< BstYI 

X Maellix Hphl X Bbill >< BspAI 

X Maelll x Hphl >< Nlall'l x Acyl >< Bglll 

ACAGGTGACA GTTGTAACAA TTTCATGCTC ACCTATAATA AGGTTGAAAA CATG ACGCCC AGAGATCTTG 
8200 8210 8220 8230 8240 8250 8260 



>< Nspl 

X NspHI 

X Nlalll 
X HinPlI 
X Hin6I 
X Hhal 

>< Cfol >< BspWI X Maelll 

GCGCATGTAT TGACTGTAAT GCAAGGCATA TCAATGCCCA AGTAGCAAAA AGTCACAATG TTTCACTCAT 
8270 8280 8290 8300 8310 8320 8330 



X Nspl 

X NspHI >< PvuII 

X Nlalll X PspSI 

X Eamll05I >< NspBII 

X Bbvl >< Fnu4HI 

X AflHI >< Alul >< Bbvl > < Fnu4HI 

CTGGAATGTA AAAGACTACA TGTCTTTATC TGAACAGCTG CGTAAACAAA TTCGTAGTGC TGCCAAGAAG 

8340 8350 8360 8370 8380 8390 8400 



X Rmal 

>< MboII >< Mael >< Eamll05I 

AACAACATAC CTTTTAGACT AACTTGTGCT ACAACTAGAC AGGTTGTCAA TGTCATAACT ACTAAAATCT 
8410 8420 8430 8440 8450 8460 8470 



>< Tru9I 

x Pall 
>< Msel 

X Haelll 
X Seal >< Esp4I 

X Rsal >< Trru9I X BsuRI 

X Csp6I >< Msel >< BshI 

x Afal X Dral X Aflll X Bbvl 

CACTCAAGGG TGGTAAGATT GTTAGTACTT GTTTTAAACT TATGCTTAAG GCCACATTAT TGTGCGTTCT 
8480 8490 8500 8510 8520 8530 8540 



X Rsal 
X Csp6I 

X BsrI >< Nlalll 

X Fnu4HI >< Afal x Maelll 

TGCTGCATTG GTTTGTTATA TCGTTATGCC AGT AC AT AC A TTGTCAATCC ATGATGGTTA CACAAATGAA 

8550 8560 8570 8580 8590 8600 8610 



X Maelll 
> < Maelll 

>< Maelll >< Fokl 

ATCATTGGTT ACAAAGCCAT TCAGGATGGT GTCACTCGTG ACATCATTTC TACTGATGAT TGTTTTGCAA 
8620 8630 8640 8650 8660 8670 8680 



Sfcl > 

X Nspl Fnu4HI X 

>< NspHI >< Nlalll Bbvl X 

X Nlalll >< Hgal X BstXI X Bbvl X Alul 

ATAAACATGC TGGTTTTGAC GCATGGTTTA GCCAGCGTGG TGGTTCATAC AAAAATGACA AAAGCTGCCC 
8690 8700 8710 8720 8730 8740 8750 



FIGURE 13. 20 



WO 2005/056584 



PCT/FR2004/003106 



34/116 

>< ScrFI 
>< ScrFI >< Rsal 

>< Mval >< Mspl 
>< EcoRII >< Hpall 
>< Ecll36I>< Neil 
>< DsaV >< HapII 
>< BstOIX DsaV 
>< BstNI >< Csp6I 

>< Fnu4HI >< BsiLI >< BcnIDdel >< 

>< Alul >< Apyl >< Afal 

TGTAGTAGCT GCTATCATTA CAAGAGAGAT TGGTTTCATA GTGCCTGGCT TACCGGGTAC TGTGCTGAGA 
8760 8770 8780 8790 8800 8810 8820 

> < Maelll X HphI X Mnll >< BspWI 

GCAATCAATG GTGACTTCTT GCATTTTCTA CCTCGTGTTT TTAGTGCTGT TGGCAACATT TGCTACACAC 
8830 8840 8850 8860 8870 8880 8890 

Tru9I > 
SfaNI >< 
X Rsal 
Msel > 

>< BspWI >< Fnu4HI X Csp6I 

>< BbvlX Mnll >< Ddel >< Afal 

CTTCCAAACT CATTGAGTAT AGTGATTTTG CTACCTCTGC TTGCGTTCTT GCTGCTGAGT GTACAATTTT 
8900 8910 8920 8930 8940 8950 8960 

> < Rmal 
>< Mnll 

>< Fokl > < Mael 

TAAGGATGCT ATGGGCAAAC CTGTGCCATA TTGTTATGAC ACTAATTTGC TAGAGGGTTC TATTTCTTAT 
8970 8980 8990 9000 9010 9020 9030 



>< Alul 



X NlalV 

>< Fokl 
>< BscBI 



ScrFI > 
Mval > 
Mnll >< 
EcoRII >< 
Ecll36I > 
DsaV >< 
BstOI > 
BstNI > 
BsiLI > 
Apyl > 



AGTGAGCTTC GTCCAGACAC TCGTTATGTG CTTATGGATG GTTCCATCAT ACAGTTTCCT AACACTTACC 



9040 



9050 



9060 



9070 



9080 



9090 



9100 



>< SfaNI 
< Mael I I 
X Gsul 
X Bpml 



X Sfcl 
>< Seal 
X Rsal 
>< Csp6I 
X Afal 
X Ddel X AccI 



X Rsal 

>< Nspl 
X NspHI 
X Nlalll 
>< Nlalll 
X Csp6I 
X Afal 



TGGAGGGTTC TGTTAGAGTA GTAACAACTT TTGATGCTGA GTACTGTAGA CATGGTACAT GCGAAAGGTC 
9110 9120 9130 9140 9150 9160 9170 



X SstI 
x Sdul 
X Sad 
Nspl I >< 
HgiAI x 
Eco24I X 
Bspl286I X 
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Ecll36II ><>< Bmyl 
Banir >< 

>< Tru9I Alw21I >< 

>< Bsrl >< Msel >< Alul 

AGAAGTAGGT ATTTGCCTAT CTACCAGTGG TAGATGGGTT CTTAATAATG AGCATTACAG AGCTCTATCA 
9180 9190 9200 9210 9220 9230 9240 

>< Tfil 

>< SfaNI >< Hinfl >< Alul >< Mnll 

GGAGTTTTCT GTGGTGTTGA TGCGATGAAT CTCATAGCTA ACATCTTTAC TCCTCTTGTG CAACCTGTGG 
9250 9260 9270 9280 9290 9300 9310 

>< Maelll 

HphI >< 

>< Eco57I > < Bbvl Fnu4HI >< 

GTGCTTTAGA TGTGTCTGCT TCAGTAGTGG CTGGTGGTAT TATTGCCATA TTGGTGACTT GTGCTGCCTA 
9320 9330 9340 9350 9360 9370 9380 



>< Rsal 
>< Csp6I >< Nlalll 
>< Maell >< Bbvl >< Fnu4HI 

X Afllll >< Afaix HphI >< BspWI 

CTACTTTATG AAAT TC AG AC GTGTTTTTGG TGAGT ACAAC CATGTTGTTG CTGCTAATGC ACTTTTGTTT 



9390 



9400 



9410 



9420 



9430 



9440 



9450 



>< 
>< 



Rsal 
NlalV 
>< Kpnl 
>< Eco64I 
>< Csp6I 
>< BscBI 
>< Asp718 
>< Banl >< Alul 

X Afal 
>< AccBlI 
X Acc65X 

TTGATGTCTT TCACTATACT CTGTCTGGTA CCAGCTTACA GCTTTCTGCC GGGAGTCTAC TCAGTCTTTT 
9460 9470 9480 9490 9500 9510 9520 



> < ScrFI 

> < Neil 
X Mspl 
>< Hpall 

>< Hinfl 
>< HapII 

> < Bcnl > 



>< Plel 
< Ddel 



>< AlulX DsaV >< AccI 



>< Rsal 
>< Csp6I 

>< Afal >< HphI >< HphI Nlalll >< 

ACTTGTACTT GACATTCTAT TTCACCAATG ATGTTTCATT CTTGGCTCAC CTTCAATGGT TTGCCATGTT 
9530 9540 9550 9560 9570 9580 9590 

TTCTCCTATT GTGCCTTTTT GGATAACAGC AATCTATGTA TTCTGTATTT CTCTGAAGCA CTGCCATTGG 
9600 9610 9620 9630 9640 9650 9660 

>< TthHB8 I 
>< Rsal 
>< Mnll 
>< Mnll 

>< Tru9I >< Csp6I 

x Tru9I >< Plel >< Bcgl/a X TaqI 

X Msel X Ddel X Nlalll X Bbvl 

X Eco57I >< Bfrl >< Hinfl >< Msel >< Maelll X Afal Fnu4HI X 
TTCTTTAACA ACTATCTTAG GAAAAGAGTC ATGTTTAATG GAGTTACATT TAGTACCTTC GAGGAGGCTG 
9670 9680 9690 9700 9710 9720 9730 



X Rsal 
x Csp6I 

x Bcgl 



x Rsal 
X Csp6I 

FIGURE 13.22 
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>< Afal >< Afal >< Alw26r 

CTTTGTGTAC CTTTTTGCTC AACAAGGAAA TGTACCTAAA ATTGCGTAGC GAGACACTGT TGCCACTTAC 
9740 9750 9760 9770 9780 9790 9800 

>< NlalV 
>< Rsar >< Dder 

>< Csp6I >< BscBr 

>< Afal >< Bfrr Alur >< 

ACAGTATAAC AGGTATCTTG CTCTATATAA CAAGTACAAG TATTTCAGTG GAGCCTTAGA TACTACCAGC 
9810 9820 9830 9840 9850 9860 9870 

>< Fnu4Hr 

>< Ddel 

>< Fnu4Hl >< Bfrl 

>< Bbvr >< Alur >< Bbvr >< Ddel >< AlwNr 

TATCGTGAAG CAGCTTGCTG CCACTTAGCA AAGGCTCTAA ATG ACT T TAG CAACTCAGGT GCTGATGTTC 
9880 9890 9900 9910 9920 9930 9940 

>< Sfcl >< Bsml 

>< Pstr >< BscCl 

TCTACCAACC ACCACAGACA TCAATCACTT CTGCTGTTCT GCAGAGTGGT TTTAGGAAAA TGGCATTCCC 
9950 9960 9970 9980 9990 10000 10010 

>< Rsal 

>< Niarrr 

>< Maerrr 

>< Csp61 >< Tru9r 

>< Afar >< Msel 

GTCAGGCAAA GTTGAAGGGT GCATGGTACA AGTAACCTGT GGAACTACAA CTCTTAATGG ATTGTGGTTG 
10020 10030 10040 10050 1CT060 10070 10080 

Xhoir >< 
Sau3Ar >< 
>< Tru9T Nderr >< 

>< Nspr Mfir >< 

>< NspHr Mbor >< 

>< Nspr >< Niarrr Dpnrr >< 

>< Fokr. >< NspHr >< Msel BstYr >< 

>< Bstno7i >< Niarrr >< Mborr BspAr >< 

>< Acer >< Afirrr > < Bbsr Bgirr >< 

GAT G AC AC AG TATACTGTCC AAGACATGTC ATT TGC AC AG CAGAAGACAT GCTTAATCCT AACTATGAAG 
10090 10100 10110 10120 10130 10140 10150 

Pall > 
Mscr > 

Haerrr > 

Eaer >< 
BsuRr > 

>< Dpnr >< Mboir Bshr > 

>< Bspl431 >< Alul Ball > 

ATCTGCTCAT TCGCAAATCC AACCATAGCT TTCTTGTTCA GGCTGGCAAT GTTCAACTTC GTGTTATTGG 
10160 10170 10180 10190 10200 10210 10220 

>< Ddel> < Tru9r 

>< Bfrr> < Mser >< Dder 

CCATTCTATG CAAAATTGTC TGCTTAGGCT TAAAGTTGAT ACTTCTAACC CTAAGACACC CAAGTATAAA 
10230 10240 10250 10260 10270 10280 10290 

>< ScrFl 
>< Mvar 
>< EcoRrr 

>< Ecll361 >< Sphr 

FIGURE 13.23 
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>< DsaV >< Pael 

>< BstOI >< Nspl 

>< BstNI >< NspHI 

>< BsiLI >< Rrual >< Nlalll 

>< Apyl >< Mael >< HphI 
TTTGTCCGTA TCCAACCTGG TCAAACATTT TCAGTTCTAG CATGCTACAA TGGTTCACCA TCTGGTGTTT 

10300 10310 10320 10330 10340 10350 10360 



>< Sau3AI 
>< Ndell 
>< Mboix Nlalll 
>< Eco31I >< DpnII 

>< BsmAI >< Tru9I>< Dpnl 

>< BsalX Nlalll >< Tru9I >< Msel >< Bspl43I 

>< Alw26I >< Msel >< BspAlX Alwl 

ATCAGTGTGC CAT GAG ACCT AATCATACCA TTAAAGGTTC TTTCCTTAAT GGATCATGTG GTAGTGTTGG 
10370 10380 10390 10400 10410 10420 10430 



>< Zsp2I 
>< PpulOI 

>< NsilX SfaNI 
X Ndel 

X Mphll03I Rsal >< 

X Tru9I >< EcoT22I Csp6I >< 

>< Msel > < Avalll >< Alul Afal >< 

TTTTAACATT GATTATGATT GCGTGTCTTT CTGCTATATG CATCATATGG AGCTTCCAAC AGGAGTACAC 
10440 10450 10460 10470 10480 10490 10500 



X Rsal 
X Csp6I>< Ddel 
X AfalX Bfrl 
GCTGGTACTG ACTTAGAAGG TAAATTCTAT 
10510 10520 10530 



>< SinI 
X Sau96l 
>< NspIV 

X NspHII >< SfcE 

X Eco47I Rsal >< 

x Cfrl3I Pstl x 

>< BsiZI >< Fnu4HI 

X Bmel8I >< Hindll Csp6I >< 

>< Avail >< Hindi >< BspWI 

X AsuIX Bsgl >< Bbvl X BspMI Afal >< 
GGTCCATTTG TTGACAGACA AACTGCACAG GCTGCAGGTA. 

10540 10550 10560 10570 



X Tru9I >< Nlalll 

x Msel >< Bbvl >< Fnu4HI HphI X 

CAGACACAAC CATAACATTA AATGTTTTGG CATGGCTGTA TGCTGCTGTT ATCAATGGTG ATAGGTGGTT 
10580 10590 10600 10610 10620 10630 10640 



X Tru9I 

X Tfil 

X Msel >< Rsal 

>< HphI >< Tru9I >< Csp6I 

>< Hinfl >< Msel >< Afal 
TCTTAATAGA TTCACCACTA CTTTGAATGA CTTTAACCTT GTGGCAATGA AGTACAACTA TGAACCTTTG 

10650 10660 10670 10680 10690 10700 10710 



X SinI 

>< Sau96I 

>< PssI 
x PspSII 

>< PpuMI 

x NspIV 
X NspHII 
>< NlalV 
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>< EcoO109I 
>< Eco47I 
X Drall 
>< Cfrl3I 
>< BsiZI 
>< BscBI 

>< Bmel8I >< Ddel 

>< Avail >< Bfrl 

>< Asul >< Mnll >< Bbvl 

ACACAAGATC AT GTTG AC AT ATTGGGACCT CTTTCTGCTC AAACAGGAAT TGCCGTCTTA GATATGTGTG 
10720 10730 10740 10750 10760 10770 10780 



>< Sau3AI 
>< Ndell 
X Mbol 

>< DpnIIX Nlalll 

X Dpnl >< Hindll 
X BspAI >< Hindi 
X Bspl43I 



X Styl 
X Rsal 

X EcoT14r 
X Ecol30I 
>< Sfcl > < Csp6l 

X Fnu4HI >< Fnu4HI >< BssTlI 

X Bbvl X Fnu4HI >< BsaJI 

x Bbvl >< Alul >< PstI >< Afal 

CTGCTTTGAA AGAGCTGCTG CAGAATGGTA TGAATGGTCG TACTATCCTT GGTAGCACTA TTTTAGAAGA 
10790 10800 10810 10820 10830 10840 10850 

X Styl 
X EcoT14I 
X Ecol30I 
X BssTlI 

x MboII > < MaelllX BsaJI 

TGAGTTTACA CCATTTGATG TTGTTAGACA ATGCTCTGGT GTTACCTTCC AAGGTAAGTT CAAGAAAATT 
10860 10870 10880 10890 10900 10910 10920 

X SfaNI 

> < Sdul 

> < NspII X Tru9I Rsal X 
X Tru9I> < Bspl286I >< Msel >< Tfil Csp6I >< 
x Msel > < Bmyl >< Fokl >< Hinfl Afal X 

GTTAAGGGCA CTCATCATTG GATGCTTTTA ACTTTCTTGA CATCACTATT GATTCTTGTT CAAAGTACAC 

10930 10940 10950 10960 10970 10980 10990 

X Xmnl >< Muni 

X BsmI Fnu4HI > 

X BscCI BspWI >< 

X Maelll >< Asp700I X Bbvl Bbvl > 

AGTGGTCACT GTTTTTCTTT GTTTACGAGA ATGCTTTCTT GCCATTTACT CTTGGTATTA TGGCAATTGC 

11000 11010 11020 11.030 11040 11050 11060 



X Nspl 

X NspHI >< Tru9I 

X Nlalll >< Msel >< BsmI 

X BspWI X Fnu4HIX BspWI X BscCI >< Maelll 

TGCATGTGCT ATGCTGCTTG TTAAGCATAA GCACGCATTC TTGTGCTTGT TTCTGTTACC TTCTCTTGCA 



11070 



11080 



11090 



11100 



11110 



11120 



11130 



X SfaNI 
x Rraal 

> < Nspl 

> < Nlalll 

>< Nhel 

X Tru9I >< Mael 

X BspWI X Msel >< Accl> < NspHIX Alul 
ACAGTTGCTT ACTTTAATAT GGTCTACATG CCTGCTAGCT GGGTGATGCG TATCATGACA TGGCTTGAAT 
11140 11150 11160 11170 11180 11190 11200 



X MamI 

>< HphI 
>< BspHI 
X BsiBI x Nlalll 

X BsaBI X Nlalll 
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> < Rmal 

> < Mael 

>< Alul 
TGGCTGACAC TAGCTTGTCT 
11210 11220 



>< Tru9I 
>< Msel 

> < Esp4I 

>< Eco57I 

> < Afirr 

GGTTATAGGC TTAAGGATTG TGTTATGTAT 
11230 11240 11250 



>< Alul 
GCTTCAGCTT TAGTTTTGCT 
11260 11270 



>< Rmal 

>< Mael I 
>< Mael 

> < Nlalll >< SfaNI >< Fnu4HI 

>< BspHI >< Alul >< Bbvl X Afllll 

TATTCTCATG ACAGCTCGCA CTGTTTATGA TGATGCTGCT AGACGTGTTT GGACACTGAT GAATGTCATT 

11280 11290 11300 11310 11320 11330 11340 

>< Sau96I 
>< Pall 
>< NspIV 
>< Nlalll 

>< Haelll 
>< Sau3AI > < Ddel 

>< Ndell >< Cfrl3I 

X Mbol >< BsuRI 

X DpnII >< BsiZI 

>< Dpnl >< BshI 

>< Bspl43I > < Bfrl 

X AccI X BspAlX Alul X Asul 

ACACTTGTTT ACAAAGTCTA CTATGGTAAT GCTTTAGATC AAGCTATTTC CATGTGGGCC TTAGTTATTT 
11350 11360 11370 11380 11390 11400 11410 

X Rmal 
>< Nlalll 

X Maeix Sfcl 

X Maelll >< Mnll >< Maelll >< AlulX Alul 

CTGTAACCTC TAACTATTCT GGTGTCGTTA CGACTATCAT GTTTTTAGCT AGAGCTATAG TGTTTGTGTG 
11420 11430 11440 11450 11460 11470 11480 

Ddel > 

>< BsrI >< Nlalll Bfrl > 

TGTTGAGTAT TACCCATTGT TATTTATTAC TGGCAACACC TTACAGTGTA TCATGCTTGT TTATTGTTTC 
11490 11500 11510 11520 11530 11540 11550 



X Pall 
x Haelll 
X Fnu4HI >< BsuRI 
>< Bbvl >< Fnu4HI X BspWI 

X Bbvl >< BspWI >< BshI >< Eco57I >< Maelll 

TTAGGCTATT GTTGCTGCTG CTACTTTGGC CTTTTCTGTT TACTCAACCG TTACTTCAGG CTTACTCTTG 
11560 11570 11580 11590 11600 11610 11620 



X Eco31I 
x BsmAI 
x Bsal 



X ScrFI 
X Mval 

X EcoRII 

x Ecll36I 

X DsaV 

X BstOI 
X BstNI 
>< BsiLI 
> < BsaJI 

>< BsaJI 
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>< DrdI >< Alw26I >< A pyl Ddel >< 

GTGTTTATGA CTACTTGGTC TCTACACAAG AATTTAGGTA TATGAACTCC CAGGGGCTTT TGCCTCCTAA 
11630 11640 11650 11660 11670 11680 11690 

>< Tru9I 
>< Msel 

>< SfaNI > < HindIII> < Tru9I 

>< Mnll >< Alul > < Msel > < Mnll > < Nlalll 

GAGTAGTATT GATGCTTTCA AGCTTAACAT TAAGTTGTTG GGTATTGGAG GTAAACCATG TATCAAGGTT 
11700 11710 11720 11730 11740 11750 11760 

>< Vnel 
>< Snol 

>< Sdul 
>< NspII 
>< HgiAI 
>< Bspl286I 
>< Bmyl >< Rsal 
>< Rsal >< ApaLI >< MboII 

X Csp6I >< Alw4 4I X Csp6I Ddel > 

>< Afal >< Maell >< Alw21I X Afal Bfrl > 

GCTACTGTAC AGTCTAAAAT GTCTGACGTA AAGTGCACAT CTGTGGTACT GCTCTCGGTT CTTCAACAAC 
11770 11780 11790 11800 11810 11820 11830 

>< NspII> < Rsal 

>< Drain 
>< SdulX Csp6I 
X MboII >< Bspl286I 

>< Hinfl >< Plel x Bmyl > < Afal >< MboII 

TTAGAGTAGA GTCATCTTCT AAATTGTGGG CACAATGTGT ACAACTCCAC AATGATATTC TTCTTGCAAA 
11840 11850 11860 11870 11880 11890 11900 

>< TthHB8I 

>< TaqI Sfcl X 

X Hindlll >< MboII >< Nlalll 

X Alul > < Eco57I >< BspWI AccI X 

AGACACAACT GAAGCTTTCG AGAAGATGGT TTCTCTTTTG TCTGTTTTGC TATCCATGCA GGGTGCTGTA 
11910 11920 11930 11940 11950 11960 11970 



X Vspl 
>< Tru9I 
x Msel 
X Asnl 

>< AselX Mnll >< Bcgl/a 



X TthHB8 I 
>< TaqI X MboII 
>< Eco57I x 



> < 

> < 

> < 
Eco57I 



Ksp632I 
Earl 

Earnll04I 
X Bcgl 



GACATTAATA GGTTGTGCGA GGAAATGCTC GATAACCGTG CTACTCTTCA GGCTATTGCT TCAGAATTTA 



11980 



11990 



12000 



12010 



12020 



12030 



12040 



X StuI 
>< ScrFI 

>< Pall 
X Mvalx Haelll 
>< EcoRIlX Ecol47l 

X Ecll36I 
>< DsaV x BsuRI 
>< BstOI 
X BstNI 

>< BspWI 
X BsiLI 

>< Fnu4HI X BsaJI X BshI Tfil x 

>< Ndel X BspWix Mnll >< Bgll >< Sfcl Hinfl x 

X Acil >< ApylX AatI > < Alul 
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GTTCTTTACC ATCATATGCC GCTTATGCCA CTGCCCAGGA GGCCTATGAG CAGGCTGTAG CTAATGGTGA 
12050 12060 12070 12080 12090 12100 12110 

>< XmnI >< Tru9I >< SfaNI 

>< HphI >< Msel >< Ddel 

>< Asp700I X Eco57I >< Bbvl Fnu4HI X 

TTCTGAAGTC GTTCTCAAAA AGTTAAAGAA ATCTTTGAAT GTGGCTAAAT CTGAGTTTGA CCGTGATGCT 

12120 12130 12140 12150 12160 12170 12180 

XhoII X 
Sau3AI >< 
Ndell >< 

Mall > 
>< Mnll 
>< Mfll 

> < Sau3AI >< Mbol 

> < Ndell DpnII >< 

> < Mbol Dpnl >< 

> < DpnII Ddel >< 

>< Dpnl BstYI X 

X BspWI X RsalBspAI >< 

> < BspAI >< Csp6IBspl43I X 
>< Nlalll >< Bspl43I >< AfalBglll >< 

GCCATGCAAC GCAAGTTGGA AAAGATGGCA GATCAGGCTA TGACCCAAAT GTACAAACAG GCAAGATCTG 
12190 12200 12210 12220 12230 12240 12250 

>< Spel >< Ksp632I > < Hindlll 

>< Rmal >< Ddel x SfaNI 

X Maelll >< MboII >< Eamll04I >< BspWI 

X Mael X BspWI X Earlx Bfrl X Alul 

AGGACAAGAG GGCAAAAGTA ACTAGTGCTA TGCAAACAAT GCTCTTCACT ATGCTTAGGA AGCTTGATAA 
12260 12270 12280 12290 12300 12310 12320 

x Thai 

X Mvnl 
X HinPlI 
>< Hin6I 

x Hhal 

X Cfol 

X BstUI 

X Tru9I >< BspSOI 

x Msel >< AccII Sfcl X 

TGATGCACTT AACAACATTA TCAACAATGC GCGTGATGGT TGTGTTCCAC TCAACATCAT ACCATTGACT 
12330 12340 12350 12360 12370 12380 12390 

X Rsal 
>< NlalV 
X Eco64I 
>< Csp6I 
X BslI 

X BsiYlx Kpnl 
X BscBI 
>< BanI 
X Asp718 

X Nlalll >< Afal 

X BstXI >< AccBlI X Maelll 

X Fnu4HI X Bbvl >< Acc65I Bsgl >< 

ACAGCAGCCA AACTCATGGT TGTTGTCCCT GATTATGGTA CCTACAAGAA CACTTGTGAT GGTAACACCT 
12400 12410 12420 12430 12440 12450 12460 

>< 2sp2I 
X PpulOI 
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>< Nsil 

>< Mphll03X 

>< NdelX EcoT22I Ddel >< 

>< Avalll >< SfaNI >< SfaNI >< Acil Bfrl >< 

TTACATATGC ATCTGCACTC TGGGAAATCC AGCAAGTTGT TGATGCGGAT AGCAAGATTG TTCAACTTAG 
12470 12480 12490 12500 12510 12520 12530 



>< Pall 

>< Haelll >< Mnll >< DdelDdel >< 
>< Tru9I>< Nlalll >< BsuRI >< Maelll >< BspWI 

>< Mseix HphI > < XcmlX BshI X Alul BspWI >< 

TGAAATTAAC ATGGACAATT CACCAAATTT GGCTTGGCCT CTTATTGTTA CAGCTCTAAG AGCCAAC TC A 



12540 



12550 



12560 



12570 



12580 



12590 



12600 



X Tru9I 
X PvuII 
x Psp5I 
X NspBII 

x Msel >< Hinfl x Plel 

X AluT > < Sfcl >< DdelX BsrI X PshAI 

GCTGTTAAAC TACAGAATAA TGAACTGAGT CCAGTAGCAC TACGACAGAT GTCCTGTGCG GCTGGTACCA 
12610 12620 12630 12640 12650 12660 12670 



Rsal >< 
NlalV X 
Kpnl X 
X Fnu4HI 
Eco64I x 
Csp6I >< 
BscBI X 
Asp718 X 

Afal X 
>< Acilx Banl 
AccBlI X 
Acc65I >< 



>< Rsal 
X Csp6I 
X Alul 

X Afal 

CACAAACAGC TTGTACTGAT 
12680 12690 



X TthHB8I 
>< TaqI 
X Sful 
X NspV 
>< Mnll 
X Lspl 
X Csp4 5I 
X BstBI 
X Bspll9I 
X BsiCI 
X Bpul4I 
X AsuII 

GACAATGCAC TTGCCTACTA TAACAATTCG AAGGGAGGTA GGTTTGTGCT 
12700 12710 12720 12730 12740 



X XhoII 
X Sau3AI 
X Ndell 
X Mfll 
X Mbol 
X DpnII 

x Dpnl 
X BstYI X Tfil 

>< BspAI X Rmal 

X Bspl43I X Hinfl 

>< Bglll >< Mael >< Ddel 

GGCATTACTA TCAGACCACC AAGATCTCAA ATGGGCTAGA TTCCCTAAGA GTGATGGTAC AGGTACAATT 
12750 12760 12770 12780 12790 12800 12810 



>< Rsal 

>< Csp6I 
>< Csp6I>< Rsal 
X AfalX Afal 



>< Sau96I 

X PssI 
>< Pall 
X NspIV 
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>< Haelll 
>< EcoO109I 
x Drall 
>< Cfrl3I 

>< BsuRI 

>< NlalV >< BsiZI Rsal > 

>< BsrI X BshI Csp6I X 

>< BscBI > < Maelll >< Asul Afal > 

TACACAGAAC TGGAACCACC TTGTAGGTTT GTTACAGACA CACCAAAAGG GCCTAAAGTG AAATACTTGT 
12820 12830 12840 12850 12860 12870 12880 



>< Sfcl 

> < MboII 
Mae II >< 
X Fnu4HI X Rsal 
X Eco57I >< Csp6I 
>< Tru9I > < Bbsl 

>< Msel >< Mnll >< Bbvt >< Alul X Afal 

ACTTCATCAA AGGCTTAAAC AACCTAAATA GAGGTATGGT GCTGGGCAGT TTAGCTGCTA CAGTACGTCT 
12890 12900 12910 12920 12930 12940 12950 



>< Rsal 
>< Sfcl >< Csp6I 
>< BspWI >< Afal >< BspMI AccI >< 

TCAGGCTGGA AATGCTACAG AAGTACCTGC CAATTCAACT GTGCTTTCCT TCTGTGCTTT TGCAGTAGAC 
12960 12970 12980 12990 13000 13010 13020 



>< Rmal 

>< Mnll 
x Mael >< HphI 

CCTGCTAAAG CATATAAGGA TTACCTAGCA AGTGGAGGAC AACCAATCAC CAACTGTGTG AAGATGTTGT 
13030 13040 13050 13060 13070 13080 13090 



>< 

x Rsal >< Rsal >< 

x MboII x Csp6I >< 

x Csp6I >< BsrI >< 

X Afal x Afal >< Maelll >< Alul >< 

GTACACACAC TGGTACAGGA CAGGCAATTA CTGTAACACC AGAAGCTAAC ATGGACCAAG AGTCCTTTGG 
13100 13110 13120 13130 13140 13150 13160 



X SinI 
X Sau96I 
X NspIV 

X NspHII 
>< Nlalll 
>< Eco47I 

X EamllOSI 
Cfrl3I 
BsiZI 
Bmel8I 
Avail 
Asul> < 



X Xcml 
Plel >< 
Hinfl 



>< Tfil 

x SfaNI >< Maelll 

>< Nlalll x Fokl >< Hinfl 

TGGTGCTTCA TGTTGTCTGT ATTGTAGATG CCACATTGAC CATCCAAATC CTAAAGGATT CTGTGACTTG 
13170 13180 13190 13200 13210 13220 13230 



> < Rsal 
>< Maell 

x Csp6I >< Ddel 

> < Afal >< BsrI X Bfrl 
AAAGGTAAGT ACGTCCAAAT ACCTACCACT TGTGCTAATG ACCCAGTGGG TTTTACACTT AGAAACACAG 

13240 13250 13260 13270 13280 13290 13300 



X Thai 
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>< SfaNI 
>< HvaZ 
X BstUI 

>< Rsal >< BspSOI 

X Csp6I >< Acil 

>< Afal >< Acil >< Sfcl >< Maelll >< AccIISfaNI >< 

TCTGTACCGT CTGCGGAATG TGGAAAGGTT ATGGCTGTAG TTGTGACCAA CTCCGCGAAC CCTTGATGCA 
13310 13320 13330 13340 13350 13360 13370 



X Zsp2I 

> < SfaNI 
>< Mphll03I>< Tru9I 

>< PpulOIX Maell Fnu4HI >< 

>< Nsil> < Fokl Bsgl >< 

>< EcoT22I >< Msel >< Bbvl 

X Aciix Avalll >< Dral X Acil >< Fnu4HI Acil x 
GTCTGCGGAT GCATCAACGT TTTTAAACGG GTTTGCGGTG TAAGTGCAGC CCGTCTTACA CCGTGCGGCA 

13380 13390 13400 13410 13420 13430 13440 



X Spel 

x Seal 

X Rsal 
X Rmal 
x Mael 

> < Csp6I >< Sfcl >< BspWI 

x'BspWI >< Afal >< AccI >< Bcgl/a Bcgl > 

CAGGCACTAG TACTGATGTC GTCTACAGGG CTTTTGATAT TTACAACGAA AAAGTTGCTG GTTTTGCAAA 
13450 13460 13470 13480 13490 13500 13510 

X ScrFI 
X Mval 

X Mali 
>< EcoRlI 
>< Ecll36I 
X BstOI 
X BstNI 

>< Bsil 
X DsaV >< BsiYI 

X BsiLI >< Piel 

X Apyl > < Fokl >< Hinfl 

GTTCCTAAAA ACTAATTGCT GTCGCTTCCA GGAGAAGGAT GAGGAAGGCA ATTTATTAGA CTCTTACTTT 
13520 13530 13540 13550 13560 13570 13580 

X Nlalll 
X Ksp632I 
X Earl 

>< Tru9I >< Eamll04I 

x Msel >< BstoAI >< Tru9I 

>< Mnll >< Alw26I >< MboII >< Msel 

GTAGTTAAGA GGCATACTAT GTCTAACTAC CAACATGAAG AG ACT AT TT A TAACTTGGTT AAAGATTGTC 
13590 13600 13610 13620 13630 13640 13650 



X Rsal 
>< NlalV 

> <: Nlalll 

>< Kpnl 
>< HphI 

> < Eco64I 
X Csp6I 

X BscBI 

> < BanI 

> < Asp718 
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>< Maelll >< Afal 

>< NspBII > < AccBlI Mae I I >< 

>< Acil >< Nlalll > < Acc65I > < Hgal 

CAGCGGTTGC TGTCCATGAC TTTTTCAAGT TTAGAGTAGA TGGTGACATG GT AC C AC AT A TATCACGTCA 

13660 13670 13680 13690 13700 13710 13720 

>< Mnll 
>< Maell 

GCGTCTAACT AAATACACAA TGGCTGATTT AGTCTATGCT CTACGTCATT TTGATGAGGG TAATTGTGAT 
13730 13740 13750 13760 13770 13780 13790 

>< Tru9I 

>< Msel >< Maelll >< Muni 

AC ATT AAAAG AAATACTCGT CACATACAAT TGCTGTGATG ATGATTATTT CAATAAGAAG GATTGGTATG 
13800 13810 13820 13830 13840 13850 13860 

>< Thai 
>< Mvnl 
>< Mlul 

>< BstUI >< Rsal 

>< BspSOI >< HphI 

>< Tfil >< Afllll >< Ddel >< Csp6I Tru9I >< 

>< Hinfl >< AccII >< Bfrl >< Afal Msel >< 
ACTTCGTAGA GAATCCTGAC ATCTTACGCG TATATGCTAA' CTTAGGTGAG CGTGTACGCC AATCATTATT 

13870 13880 13890 13900 13910 13920 13930 

XhoII > 
Sau3AI > 
Ndell > 
Mfll > 

> < SfaNI >< Rsal Mbol > 

>< Rsal > < Csp6I DpnII > 

>< Csp6I >< BspWI BstYI > 

>< Afal >< SfaNI >< Afal BspAI > 

AAAGACTGTA CAATTCTGCG ATGCTATGCG TGATGCAGGC ATTGTAGGCG TACTGACATT AGATAATCAG 
13940 13950 13960 13970 13980 13990 14000 

> < ScrFI 

> < Mval 

>< Fnu4HI 
>< EcoRII 

> < Ecll36l 

> < BstOI 

> < BstNI 

>< Tru9I >< Rsal >< BslI 

>< Msel >< Rsal > < HphI >< BsiYI 

>< Opnl >< Csp6l >< Csp6I > < BsiLI 

>< Bspl43I >< BsrI > < Bbvl > < Apyl 

>< Alwl >< Afal >< Afal >< DsaV >< Acil 

GATCTTAATG GGAACTGGTA CGATTTCGGT GATTTCGTAC AAGTAGCACC AGGCTGCGGA GTTCCTATTG 
14010 14020 14030 14040 14050 14060 14070 

>< SfaNI 
>< Rmal > < Hinfl 

>< MamI >< Mnll >< Fnu4HIPleI >< 

>< Tfil >< SfaNI >< BsiBI >< Mael >< Ddel 

>< Hinfl >< Fokl >< BsaBI >< Bbvl >< BspWI Ndel >< 

TGGATTCATA TTACTCATTG CTGATGCCCA TCCTCACTTT GACTAGGGCA TTGGCTGCTG AGTCCCATAT 
14080 14090 14100 14110 14120 14130 14140 



>< Sau3AI 
>< Ndel I 
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>< Mbol 
>< MamI 
>< Dpnri 
>< Dpnl 

>< BspWI 
>< BspAI 

X Bspl43I 
X BsiBI 

X BsaBI >< Fokl 



>< Xcnvl 
>< Tru9I 
>< Msel 



Tthllll >< 
MboII >< 
>< Ksp632I 
>< Eamll04I 

>< BsmAl 
X Earr Aspl >< 
X Alw26I 



GGATGCTGAT CTCGCAAAAC CACTTATTAA GTGGGATTTG C TGAAAT AT G ATTTTACGGA AGAGAGACTT 



14150 



14160 



14170 



14180 



14190 



14200 



14210 



> < SinI 

> < Sau96I 

> < NspIV 
>< NspHII 
>< NlalV 

>< Fokl 

> < Eco47I 

> < Cfrl3I 

> < BsiZI 
>< Sspix BscBI 

< Tru9I > < Bmel8I 

< MseT > < Avail >< Tru9I 
>< Dral > < Asul >< Muni >< Msel 

TGTCTCTTCG ACCGTTATTT TAAATATTGG GACCAGACAT ACCATCCCAA TTGTATTAAC TGTTTGGATG 
14220 14230 14240 14250 14260 14270 14280 



X TthHB8I 
X TaqI 

>< Mcrl 

> < Ksp632I 

> < Earl 

> < Eamll04I 
>< BsmAI > 

X MboII X BsiEI> 
X Alw26I 



SinI X 
Sau96I >< 
NspIV >< 
NspHII > 
Eco47I >< 
Cfrl3I X 
BsiZI X 
Bmel8I X 

X Tru9l Avail X 

X Fokl X Msel Asul X 

ATAGGTGTAT CCTTCATTGT GCAAACTTTA ATGTGTTATT TTCTACTGTG TTTCCACCTA CAAGTTTTGG 
14290 14300 14310 14320 14330 14340 14350 

X Spel 
X Rmal 

>< Mael >< Sspl >< BsrI 

ACCACTAGTA AGAAAAATAT TTGT AG AT GG TGTTCCTTTT GTTGTTTCAA CTGGATACCA TTTTCGTGAG 
14360 14370 14380 14390 14400 14410 14420 

X Thalx Esp3I 

>< Ddel 
X BstUI 

X Bsp50I X BsmBI 
X Mvnix BsmAI 
X HgalX Alul X Alw26I 

>< Fokl >< AccII > < Bbvl 



x Rsal 
X Hinfl X Plel 
> < Csp6I 
>< Afal 



TTAGGAGTCG TACATAATCA GGATGTAAAC TTACATAGCT CGCGTCTCAG TTTCAAGGAA CTTTTAGTGT 
14430 14440 14450 14460 14470 14480 14490 



X Zsp2I 
>< SphI 
>< PpulOI 

>< Pael 
X Nspl 
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>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 

> < Dpnl 

>< Fnu4HIX BspWI 
>< BspAI 

> < Bspl43I> 
>< Alwl >< Alul 



>< NspHI 
X Nsil 

>< Nlalll 
>< Mphll03I 

>< Fnu4HI 
>< EcoT22I 
>< BspWI 

< Avalll > < AlwNI 

>< Alul >< Bbvl 



>< 
X 



Rmal 
Mae I 



NspHI 
Nlalll 

>< 
>< 



>< 
>< 
>< 

BspWI 
Bsgl 



Nspl 



>< Bbvl 



ATGCTGCTGA TCCAGCTATG CATGCAGCTT CTGGCAATTT ATTGCTAGAT AAACGCACTA CATGCTTTTC 



14500 



14510 



14520 



14530 



14540 



14550 



14560 



>< ScrFI 
>< Neil 
>< Mspl 
>< Hpall 

X Fnu4HI X HapII 

>< AlwNI >< DsaV X Tru9I 

X Alul >< Bcnl X Msel 

AGTAGCTGCA CTAACAAACA ATGTTGCTTT TCAAACTGTC AAACCCGGTA ATTTTAATAA AGACTTTTAT 

14570 14580 14590 14600 14610 14620 14630 

>< Tru9I Ddel >< 

X Msel >< Mbol I Bbvl >< 

GACTTTGCTG TGTCTAAAGG TTTCTTTAAG GAAGGAAGTT CTGTTGAACT AAAACAC TTC TTCTTTGCTC 

14640 14650 14660 14670 14680 14690 14700 

>< Fokl EcoRV X 

X Fnu4HI Eco32I X 

AGGATGGCAA CGCTGCTATC AGTGATTATG ACT AT TAT CG TTATAATCTG CCAACAATGT GTGATATCAG 

14710 14720 14730 14740 14750 14760 14770 

X Vspl 
X Tru9I 
X Msel 
X Asnl 

>< Maelll X Asel 

ACAACTCCTA TTCGTAGTTG AAGTTGTTGA T AAAT ACT T T GATTGTTACG ATGGTGGCTG TATTAATGCC 
14780 14790 14800 14810 14820 14830 14840 



X Tru9I 

X Msel 
X Hpal 
X Hindu 
X Hindi 



X PvuII 
X Psp5I 
X NspBII 
X Alul 



> < Xcml 
>< Tru9I 
>< Msel 



Rmal X 
Mael >< 



AACCAAGTAA TCGTTAACAA TCTGGATAAA TCAGCTGGTT TCCCATTTAA TAAATGGGGT AAGGCTAGAC 



14850 



14860 



14870 



14880 



14890 



14900 



14910 



>< 

X 
X 



X SfaNI 

X Sau3AI 
x Ndell 
X Mbol 

X DpnII X 
X Dpnl 

X Plel >< Bspl43I 

X Hinfix Mnll >< BspAI X Alwl 
TTTATTATGA CTCAATGAGT TATGAGGATC AAGATGCACT TTTCGCGTAT ACTAAGCGTA ATGTCATCCC 
14920 14930 14940 14950 14960 14970 14980 



Thai 
Mvnl 
BstUI 
X Bstll07I 
BspWI X Fokl 
>< Bsp50I 
X Accllx Ddel 
X AccI 



>< SstI 
>< Sdul 
>< SacI 
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>< NspII 
X HgiAl 
X Eco24I 

X Tru9I > < Ecll36II 

>< Tfil >< Bspl286I 

>< Msel >< Bmyl 

x Hinfl >< Banll 

> < Esp4I >< Alw21I 

> < Aflll >< BspWI > < Alul X Alul 
TACT AT AACT CAAATGAATC TTAAGTATGC CATTAGTGCA AAGAATAGAG CTCGCACCGT AGCTGGTGTC 

14990 15000 15010 15020 15030 15040 15050 

Rmal >< 

x Seal > < Mnll 

>< SfcIX Rsal Mael X 

X BsraAI X Csp€I >< Fnu4HI 

>< Alw26I X Afal >< Acil 

TCTATCTGTA GTACTATGAC AAATAGACAG TTTCATCAGA AATTATTGAA GTCAATAGCC GCCACTAGAG 
15060 15070 15080 15090 15100 15110 15120 

>< Tru9I 

X Alul >< Msel 

GAGCTACTGT GGTAATTGGA ACAAGCAAGT TTTACGGTGG CTGGC AT AAT ATGTTAAAAA CTGTTTACAG 
15130 15140 15150 15160 15170 15180 15190 

Nspl >< 
NspHI X 
Nlalll X 
X Nlalll 

Ddel >< 
BspWI X 
X MaelTI Bfrl >< 

TGATGTAGAA ACTCCACACC TTATGGGTTG GG AT TATCC A AAATGTGACA GAGCCATGCC TAACATGCTT 
15200 15210 15220 15230 15240 15250 15260 

> < Pall 

> < Haelll 

> < BsuRI 

> < BshI >< Mnll >< Maelll Sfcl X 
AGGATAATGG CCTCTCTTGT TCTTGCTCGC AAACATAACA CTTGCTGTAA CTTATCACAC CGTTTCTACA 

15270 15280 15290 15300 15310 15320 15330 

Tru9I x 

ScrFI > 
Mval > 
X Msel 

x MstI Fokl X 

x HinPlI EcoRII >< 

x Hin6I Ecll36I > 

> < Hhal DsaV X 
>< Fspl BstOI > 
X Fdill >< Nlalll BstNI > 

> < CfoIX Tru9I > < Fnu4HI BsiLI > 
X Alul >< Avill X Msel >< Acil Apyl > 

GGTTAGCTAA CGAGTGTGCG CAAGTATTAA GTGAGATGGT CATGTGTGGC GGCTCACTAT ATGTTAAACC 
15340 15350 15360 15370 15380 15390 15400 

> < SfaNI 

x Mspl 

>< Hpall >< HphI >< Tru9I Maelll >< 

X HapII >< BspWI >< Msel Alul X 
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AGGTGGAACA TCATCCGGTG ATGCTACAAC TGCTTATGCT AATAGTGTCT TTAACATTTG TCAAGCTGTT 
15410 15420 15430 15440 15450 15460 15470 

>< DrdI 

>K Bs P WI >< Alul > <AciI 

ACAGCCAATG TAAATGCACT TCTTTCAACT GATGGTAATA AGATAGCTGA CAAGTATGTC CGCAATCTAC 
15480 15490 15500 15510 15520 15530 15540 

>< Sau3AI 
>< Ndeir 
>< Mbol 
> < MamI 

>< Fbal 
>< Dpnll 

>< Dpnl 
>< BspHI 
X BspAX 

>< Bspl43I 
X BsiQI 

X Sfcl > < BsiBlx Nlalll 

X BsmAI > < BsaBIX Fokl 

>< Alw26I >< BclIX EcoRI Fokl X 

AACACAGGCT CTATGAGTGT CTCTATAGAA ATAGGGATGT TGATCATGAA TTCGTGGATG AGTTTTACGC 
15550 15560 15570 15580 15590 15600 15610 

X Tfil 

>< SfaNI 
X Nlalll 

X BspMI >< Hinfl >< Maelll 

TTACCTGCGT AAACATTTCT CCATGATGAT TCTTTCTGAT GATGCCGTTG TGTGCTATAA CAGTAACTAT 
15620 15630 15640 15650 15660 15670 15680 

> < Rmal 
>< Nhel x Tru9I 
X Fnu4HI > < Mael x Tru9I 

>< Acil >< Alul x Msel x Msel MnlT x 

GCGGCTCAAG GTTTAGTAGC TAGCATTAAG AACTTTAAGG CAGTTCTTTA TTATCAAAAT AATGTGTTCA 
15690 15700 15710 15720 15730 15740 15750 

>< SinI 
x Sau96I 
>< PssI 

x Psp5II 
>< PpuMI 
>< NspIV 

X NspHII 
>< EcoO109l 
X Eco47I 
>< Drall 
>< Cfrl3I 
>< BsiZI 

>< Ddel >< Bmel8I 

X Nlalll >< BsmAI >< Avail 

X Ddel x Alw26I >< Asul >< Mnll 

TGTCTGAGGC AAAATGTTGG ACTGAGACTG ACCTTACTAA AGGACCTCAC GAATTTTGCT CACAGCATAC 
15760 15770 15780 15790 15800 15810 15820 

X XhoII 
X Sau3AI 
>< Ndell 
x Mfll 
>< Mbol 

FIGURE 13. 36 
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>< Rsal >< DpnII 

X Maell >< Dpnl > < SspX 

X Tru9I >< Csp6T >< BstYT HinPlI >< 

>< Rmal >< BsaAI >< BspMI Hin6I >< 

X Mael >< Aflllt >< BspAI Hhal >< 

X BspWIX Msel >< Afal >< AlwlX Bspl43I Cfol >< 

AATGCTAGTT AAACAAGGAG ATGATTACGT GTACCTGCCT TACCCAGATC CATCAAGAAT ATTAGGCGCA 
L5830 15840 15850 15860 15870 15880 15890 

>< Rsal >< SfaNI 

>< TthHB8 I x Csp6I >< Maelll 

>< Taql >< Afal Bsrr X 

GGCTGTTTTG TCGATGATAT TGTCAAAACA GATGGTACAC TTATGATTGA AAGGTTCGTG TCACTGGCTA 
15900 15910 15920 15930 15940 15950 15960 

> < Fokl 
X BspWI 

TTGATGCTTA CCCACTTACA AAACAT CCTA ATCAGGAGTA TGCTGATGTC TTTCACTTGT ATTTACAATA 
15970 15980 15990 16000 16010 16020 16030 

>< Van91I 
>< PflMr 
>< Nspl 

> < PallX NspHt 

> < Mscix Nlalll 

> < Haein 

> < BsuRl 
>< Bsrr 

>< Eaer >< BslI X Nspl 

> < BshlX BsiYl X NspHI 

>< Niarn x Afinr >< Afinr 

>< Maelll >< Alul > < Bairx AccB71 X Nlairr 

CATTAGAAAG TTACATGATG AGCTTACTGG CCACATGTTG GACATGTATT CCGTAATGCT AACTAATGAT 
16040 16050 16060 16070 16080 16090 16100 

X Rsal> < NlalV 
>< Mnir 

X Csp61 X Ddel >< Rsal 

>< Bsrl >< Mnir >< Csp61 

X Afar> < BscBI >< Afal Sfcl X 

AACACCTCAC GGT ACTGGGA ACCTGAGTTT TATGAGGCTA TGTACACACC ACATACAGTC TTGCAGGCTG 

16110 16120 16130 16140 16150 16160 16170 

X NlarV 

X EcoNr 
X Eco311 
x Eco641>< BsmAI 

X BscBr X Bsir 
x Ban! >< BsiYI 
>< Acir x Bsal 

X BspWI >< AccBlIX Alw261 Bbvl X 

TAGGTGCTTG TGTATTGTGC AATTCACAGA CTTCACTTCG TTGCGGTGCC TGTATTAGGA GACCATTCCT 
16180 16190 16200 16210 16220 16230 16240 

X Tthllll 

>< Fnu4Hr >< Nlalll > < Tru9I 

X BspWI X Aspl > < Mser 

ATGTTGCAAG TGCTGCTATG ACCATGTCAT TTCAACATCA CACAAATTAG TGTTGTCTGT TAATCCCTAT 
16250 16260 16270 16280 16290 16300 16310 



>< ScrFl 
x Mval 
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X EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI 

>< BstNI 

>< BsiLI >< Rmal 

>< BsaJI >< Mnll BspWI >< 

>< Apyl >< Maelll >< Maelll >< Mael >< Alul 

GTTTGCAATG CCCCAGGTTG TGATGTCACT GATGTGACAC AACTGTATCT AGGAGGTATG AGCTATTATT 
16320 16330 16340 16350 16360 16370 16380 

>< Maelll >< Mnll 

GCAAGTCACA TAAGCCTCCC ATTAGTTTTC CATTATGTGC TAATGGTCAG. GTTTTTGGTT TATACAAAAA 
16390 16400 16410 16420 16430 16440 16450 



>< Nspl 

X NspHI > < Tthllll 

>< NlalllX MaelllX Maelll 
>< Afllll >< Aspl 



>< Nspl 
>< NspHI 
>< Nlalll 
>< Afllll 



CACATGTGTA GGCAGTGACA ATGTCACTGA CTTCAATGCG ATAGCAACAT GTGATTGGAC TAATGCTGGC 
16460 16470 16480 16490 16500 16510 16520 



X Rsal 
X Plel 
x Ode I 
X Csp6I 

>< BsmAI >< Hinfl >< Mall 

X Alw26I >< Hindlll Ddel >< 

X Afal >< Alul >< Fnu4HI X Bbvl 

GATTACATAC TTGCCAACAC TTGTACTGAG AG ACT C AAGC TTTTCGCAGC AGAAACGCTC AAAGCCACTG 



16530 



16540 



16550 



16560 



16570 



16580 



16590 



> < Thai 

X Seal 
>< Rsal >< Rsal 

> < Mvnl 

>< Csp6I >< Csp6I 

> < BstOI 

> < Tru9I > < BspSOI 

> < Msel > < Ndel >< Afal >< Afal 

X Alul > < AccII Mnll > 

AGGAAACATT TAAGCTGTCA TATGGTATTG CCACTGTACG CGAAGTACTC TCTGACAGAG AATTGCATCT 
16600 16610 . 16620 16630 16640 16650 16660 

Maelll >< 
x Maelll 
x Eco0651 
>< Eco91I 
>< BstPI 

X SfaNI >< Rmal >< BstEII 

x Nlalll >< Mael >< BsrI 

TTCATGGGAG GTTGGAAAAC CTAGACCACC ATTGAACAGA AACTATGTCT TTACTGGTTA CCGTGTAACT 
16670 16680 16690 16700 16710 16720 16730 



Rsal >< 
>< Mnll 

x Rsal >< Rsal >< HphI 

X Csp6I >< Csp6I >< SfaNI Csp6I X 

x Afal >< Afal x Maelll >< HphI Afal x 

AAAAATAGTA AAGTACAGAT TGGAGAGTAC ACCTTTGAAA AAGGTGACTA TGGTGATGCT GTTGTGTACA 
16740 16750 16760 16770 16780 16790 16800 
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>< Rsal >< HphI 

>< Csp6I >< Hindi I Ddel >< 

>< Afal X Hindi Bfrl >< 

GAGGTACTAC GACATACAAG TTGAATGTTG GTGATTACTT TGTGTTGACA TCTCACACTG TAATGCCACT 



16810 



16820 



16830 



16840 



16850 



16860 



16870 



>< Vnel 
X Snol 

>< Sdul 

>< NspII 

>< HgiAI 
X Drain 

>< Bspl286I 

>< Bmyl 
>< ApaLI >< Rmal 
>< ALw44I >< Mael 

>< Alw21I 



>< 



Sdul 
NspII 
HgiAI 

>< Drain >< Rsal 

Bspl286I >< Csp6I 

Bmyl >< BsrI 

Alw21I >< Afal Ddel > 

TAGTGCACCT ACTCTAGTGC CACAAGAGCA CTATGTGAGA ATTACTGGCT TGTACCCAAC ACTCAACATC 
16880 16890 16900 16910 16920 16930 16940 



> < 

> < 

> < 
BspWI 

> < 

> < 

> < 



Styl >< 

SinI > 
Sau96I > 
NspIV > 
EcoTl4I >< 

Eco4 7l > 
Ecol30I >< 
>< Seal Cfrl3I > 
BssTlI >< 
>< SphI >< Rsal BsiZI > 
>< Pael BsaJI >< 

>< Nlalll Bmel8I > 

>< Rmal >< Nsplx Csp6I Avail > 

>< Mael >< NspHlx Afal Asul > 

TCAGATGAGT TTTCTAGCAA TGTTGCAAAT TATCAAAAGG TCGGCATGCA AAAGTACTCT ACACTCCAAG 
16950 16960 16970 16980 16990 17000 17010 

>< ScrFI 

X Rsal 
>< Mval 
>< EcoRII 
>< Ecll36I 

> < Csp6I 
>< BstOI 
>< BstNI 
X Xcml >< BslI 
>< NspHII >< BsiYI 
>< BsiLI 

>< Apyl >< BsrI 
>< DsaVX Afal > < HinfIX Plel 
GACCACCTGG TACTGGTAAG AGTCATTTTG CCATCGGACT TGCTCTCTAT TACCCATCTG CTCGCATAGT 
17020 17030 17040 17050 * 17060 17070 17080 



X SfaNI 
X SphI >< PvuII 

X PspSI 
X NspBII 

>< Fnu4HI > < Tru9I 

< NlalllX BspWI >< Sspl 

X Alul X Bbvl > < Msel 

GTATACGGCA TGCTCTCATG CAGCTGTTGA TGCCCTATGT GAAAAGGCAT TAAAATATTT GCCCATAGAT 
17090 17100 17110 17120 17130 17140 17150 



>< Pael 
X Nspl 
X NspHI 
X Bstll07I > 
X AccI >< Nlalll 
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> < Thai 
>< Thai 

> < Mvnl 
>< Mvnl >< Thai 

> < HinPlI 
>< HinPlI 

>< HinPlI >< Mvnl 

> < Hin6I 
>< Hin6I 

> < Hhal 
>< Hhal >< Hhal 

> < Cfol 
>< Cfol >< Cfol 

> < BstUI 
X BstUI >< BstUI 

X BssHII 
X BspMI 

> < BspSOI 

>< BspSOIX Bsp50I R*nal > 

>< Tfil >< Hin6I> < AccII Mael > 

>< Hinfl >< AccII >< AccII > < EcoRI 

AAATGTAGTA GAATCATACC TGCGCGTGCG CGCGTAGAGT GTTTTGATAA ATTCAAAGTG AATTCAACAC 
17160 17170 17180 17190 17200 17210 17220 

>< Zsp2I 
X PpulOI 

>< Nsil 

>< Mphll03I 

>< EcoT22I 

>< Bsgl > < Avail I >< DrdI 

TAGAACAGTA TGTTTTCTGC ACTGTAAATG CATTGCCAGA AACAACTGCT GACATTGTAG TCTTTGATGA 
17230 17240 17250 17260 17270 17280 17290 

>< Rmal 

>< Mael >< Maell 

AATCTCTATG GCTACTAATT ATGACTTGAG TGTTGTCAAT GCTAGACTTC GTGCAAAACA CTACGTCTAT 

17300 17310 17320 17330 17340 17350 17360 

>< Sau3AI 
>< Ndell 
X Mbol 
X DpnII 
X Dpnl 

X BspAI ><: K™ 31 

X AlwIX Bspl43I > < Acil >< Mael Sspl >< 

ATTGGCGATC CTGCTCAATT ACCAGCCCCC CGCACATT GC TGACTAAAGG CACACTAGAA CCAGAATATT 

17370 17380 17390 17400 17410 17420 17430 

X SinI 
>< Sau96I 

x NspIV x Styl 

X NspHII >< Nspl 

X Eco47I >< NspHI 

X Cfrl3I >< Nlalll 

X BsiZI >< EcoT14I 

x Bsgl >< Ecol30I 

>< Bmel8I >< BssTlI 

X Tru9I >< Avail >< BsaJI 

>< Msel >< Asul> < Afllll 

TTAATTCAGT GTGCAGACTT ATGAAAACAA TAGGTCCAGA CATGTTCCTT GGAACTTGTC GCCGTTGTCC 

17440 17450 17460 17470 17480 17490 17500 

FIGURE 13. 40 
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>< Hindll 

>< Hindi >< Alul 

TGCTGAAATT GTTGACACTG TGAGTGCTTT AGTTTATGAC AATAAGCTAA AAGCACACAA GGATAAGTCA 

17510 17520 ' 17530 17540 17550 17560 17570 

X Alul >< Nlalll 

GCTCAATGCT TCAAAATGTT CTACAAAGGT GTTATTACAC ATGATGTTTC ATCTGCAATC AACAGACCTC 
17580 17590 17600 17610 17620 17630 17640 

>< Mnll 
>< EcoNI 

>< BslI >< HphI 

>< BsiYI >< Alul 

AAATAGGCGT TGTAAGAGAA TTTCTTACAC GCAATCCTGC TTGGAGAAAA GCTGTTTTTA TCTCACCTTA 

17650 17660 17670 17680 17690 17700 17710 

>< Sfcl >< Ddel >< Tfil 

> < Alul >< Bfrl >< Hinfl 

TAATTCACAG AACGCTGTAG CTTCAAAAAT CTTAGGATTG CCTACGCAGA CTGTTGATTC ATCACAGGGT 
17720 17730 17740 17750 17760 17770 17780 

> < Hindll 

>< Tthllll > < HincIX 

>< Aspl >< Acil 

TCTGAATATG ACTATGTCAT ATTCACACAA ACTACTGAAA CAGCACACTC TTGTAATGTC AACCGCTTCA 

17790 17800 17810 17820 17830 17840 17850 

>< XhoII 
x Sau3AI 
X Ndell 
>< Mfll 
>< Mbol 
>< MamI 
>< DpnII 

X Dpnl 
X BstYI 
X BspAI 

X Bspl43I 
>< BsiBI 
X BsaBI 
X BspWI X Bglll 

ATGTGGCTAT CACAAGGGCA AAAATTGGCA TTTTGTGCAT AATGTCTGAT AGAGATCTTT ATGACAAACT 
17860 17870 17880 17890 17900 17910 17920 



x Xbal 

>< Rmal >< Maelll 

x Mael x Maell BsrI x 

GCAATTTACA AGTCTAGAAA TACCACGTCG CAATGTGGCT AC AT T AC AAG CAGAAAATGT AACTGGACTT 



17930 



17940 



17950 



17960 



17970 



17980 



17990 



>< Tru9I 

X Mseix Sfcl 



X Sau3AI 
>< Ndell 

x Mbol I 
>< Mbol 

> < Fokl 
X DpnII 

x Dpnl 
X BspAI 

X Bspl43I 

X Bbsl > < BsrI 



X NlalV 
>< Eco64I 

>< BscBI 
X BanI 
X AccBlI 



Mnll X 
>< Ddel 
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TTTiVAGGACT GTAGTAAGAT CATTACTGGT CTTCATCCTA CACAGGCACC TACACACCTC AGCGTTGATA 
18000 18010 18020 18030 18040 18050 18060 



>< ScrFI 
>< Mval 
>< EcoRII 
>< Eco57I 

>< EC1136I 
X DsaV 
>< BstOI 
>< BstNI 
>< Hindlix BsiLI 
>< HincIIX Apyl 

TAAAGTTCAA GACTGAAGGA TTATGTGTTG ACATACCAGG CATACCAAAG GACATGACCT ACCGTAGACT 
18070 18080 18090 18100 18110 18120 18130 



>< Plel 
X Nlalll 

Hinfl X 
AccI X 



X Maelll Thai X 

X Eco0651 Mval X 

X Eco91I BstUI >< 

>< BstXI BspSOI >< 

X BstPI X Acil 

X BstEII X HphI AccII X 

CATCTCTATG ATGGGTTTCA AAATGAATTA CCAAGTCAAT GGTTACCCTA ATATGTTTAT CACCCGCGAA 

18140 18150 18160 18170 18180 18190 18200 



X XmnI 

> < MboII >< SfaNI 

> < Maelll >< Rmal 
X Asp700I >< Nlalll 

>< Alul X Maell >< Mnll >< Mael 

GAAGCTATTC GTCACGTTCG TGCGTGGATT GGCTTTGATG TAGAGGGCTG TCATGCAACT AGAGATGCTG 



18210 



18220 



18230 



18240 



18250 



18260 



18270 



X Rsal 
X Gsul 

>< Csp6I 
X Bpral 

X Afal 



X Rmal 

X Mnll 
X Mael 
X Alul 



X Sfcl 



X Tru9I 

X Msel 
>< Hpal 
>< Hindll 
>< Hindi 



>< Rsal 
x Csp6I 
X Ddel >< Alul BsrI >< 
X Bfrl >< Afal 



TGGGTACTAA CCTACCTCTC CAGCTAGGAT TTTCTACAGG TGTTAACTTA GTAGCTGTAC CGACTGGTTA 
18280 18290 18300 18310 18320 18330 18340 



X Hindll 
>< Hindi 



X HphI 

X EcoRI 



X Tru9I 
X Msel 

FIGURE 13,42 



x ScrEI 
>< Mval 

x Mnll 
>< Maelll 
X EcoRII 

>< Eco0651 
x EcoNI 

X Eco91I 
x EC1136I 
>< DsaV Tru9I >< 
X Drain 
X BstPI 
X BstOI 

>< BstNI Pmel >< 
X BstEII 
X BslI Msel X 
X BsiYI HphI X 
>< BsiLI Dral X 
>< Apyl >< BsrI 



WO 2005/056584 



56A16 



PCT/FR2004/003106 



TGTTGACACT GAAAATAACA CAGAATTCAC CAGAGTTAAT GCAAAACCTC CACCAGGTGA CCAGTTTAAA 
18350 18360 18370 18380 18390 18400 18410 

>< ScrFI 

>< Mval 
>< EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI 

>< BstNI >< Rsal 

>< BsiLI Ddel >< 

>< BsaJI > < Tru9I>< Csp6I 

>< Nlalll >< Apyl > < Msel >< Afal 

CAT CT TAT AC CACTCATGTA TAAAGGCTTG CCCTGGAATG TAGTGCGTAT TAAGATAGTA CAAATGCTCA 
18420 18430 18440 18450 18460" 18470 18480 

>< Nlalll 
>< HinPlI 
>< Tthllll >< Hin6I 

>< Hinfl > < Hhal 

>< Aspl >< Plel > < Cfol >< Alul 

GTGATACACT GAAAGG AT T G TCAGACAGAG TCGTGTTCGT CCTTTGGGCG CATGGCTTTG AGCTTACATC 
18490 18500 18510 18520 18530 18540 18550 

>< SinI 
>< Sau96I 
>< NspIV 

>< NspHII 
>< Eco4 7I 
>< Cfrl3I 
>< Seal >< BsiZI 

>< Rsal >< Bmel8I 

>< Csp6I >< Avair >< Maell 

>< Afal >< Asul >< Afllll >< Maellix Maell 

AATGAAGTAC TTTGTCAAGA TTGGACCTGA AAGAACGTGT TGTCTGTGTG ACAAACGTGC AACTTGCTTT 
18560 18570 18580 18590 18600 18610 18620 

> < Tf il >< .Tthllll 

> < Hinfl > < Aspl 

TCTACTTCAT CAGATACTTA TGCCTGCTGG AATCATTCTG TGGGTTTTGA CTATGTCTAT AACCCATTTA 
18630 18640 18650 18660 18670 18680 18690 

>< ScrFI 
Rsal >< 
>< Mval 
>< EcoRII 
EC1136I >< 

>< DsaV 
Csp6I >< 

BstXI >< 

> < Maelll >< BstOI 

> < Eco0651 >< BstNI 

> < Eco91I >< BsiLI 

> < BstPI >< Apyl 
>< Eco57I> < BstEII >< Maelll >< Nlalll Afal >< 

TGATTGATGT TCAGCAGTGG GGCTTTACGG GTAACCTTCA GAGTAACCAT GACCAACATT GCCAGGTACA 
18700 18710 18720 18730 18740 18750 18760 

>< SfaNI 
>< Rmal 
>< Nspl 
>< NspHI 

FIGURE 13.43 
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>< Nlalll X Rmal 

>< Mael >< Nlalll Tru9I >< 

>< Nlalll >< BspWI X Mael >< Nlalll 

> < Afllll >< BspHI Msel >< 

TGGAAATGCA CATGTGGCTA GTTGTGATGC TATCATGACT AGATGTTTAG CAGTCCATGA GTGCTTTGTT 

18770- 18780 18790 18800 18810 18820 18830 

X Thai 

>< Mvnl 
X HinPlI 
>< Hin6I 

X Hhal 

X Cfol 

>< BstUI >< EcoNI> < Mnll 

>< Bsp50I >< BslI >< Tru9I 

>< AccII >< BsiYI >< Ddel >< Msel 

AAGCGCGTTG ATTGGTCTGT TGAATACCCT ATTATAGGAG ATGAACTGAG GGTTAATTCT GCTTGCAGAA 
18840 18850 18860 18870 18880 18890 18900 

X Rsal 

X Csp6I >< MboII > < Nlalll 

>< Afal X Nlalll X BspWI X Bsrl >< BspHI 

AAGTACAACA CATGGTTGTG AAGTCTGCAT TGCTTGCTGA TAAGTTTCCA GTTCTTCATG AC ATT GG AAA 
18910 18920 18930 18940 18950 18960 18970 

X Saul 
X Mstll 
X Eco81I 

X Ddel Nlalll >< 

X Cvnl >< Espl 

X Bsu36I >< Eco57I Maelll X 

>< Bse21I >< Ddel 

>< Axyl >< Celll 

X AocI X Mnll >< SfaNI X Bpull02I 

TCCAAAGGCT ATCAAGTGTG TGCCTCAGGC TGAAGTAGAA TGGAAGTTCT ACGATGCTCA GCCATGTAGT 
18980 18990 19000 19010 19020 19030 19040 

X Mnll >< Ksp632I 

>< Hindlll >< Earl 

>< Alul >< MboII >< Eamll04I 

GACAAAGCTT ACAAAATAGA GGAACTCTTC TATTCTTATG CTACACATCA CGATAAATTC ACTGATGGTG 
19050 19060 19070 19080 19090 19100 19110 

X Sau3AI 
X Ndell 
X Mbol 
>< MaeII> < Maelll 
>< DpnII 
X Dpnl 

X BspAI Hinfl > 

X Maelll X Bspl43I >< Muni DrdI >< 

TTTGTTTGTT TTGGAATTGT AACGTTGATC GTTACCCAGC CAATGCAATT GTGTGTAGGT TTGACACAAG 
19120 19130 19140 19150 19160 19170 19180 

Zsp2I X 

>< SphI 
> < PpulOI 
>< Pael 
>< Nspl 

X ScrEI >< NspHI 

>< Mval >< Nlalll 

X EcoRri Mphll03I >< 

FIGURE 13.44 
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>< Ecll36I >< Gsul 

>< DsaV EcoT22I >< 

>< BstOI >< Bstal 

>< BstNI >< BscCI 

>< BsiLI >< Bpml >< Nsil 

x. Plel >< Apyl >< Avalll 
AGTCTTGTCA AACTTGAACT TACCAGGCTG TGATGGTGGT AGTTTGTATG TGAATAAGCA TGCATTCCAC 

19190 19200 19210 19220 19230 19240 19250 

>< Tru9I 

> < Muni 

>< TthHB8I >< Msel 

>< Bcgl/a >< TaqI >< Dral 

>< Alul >< Bcgl 

ACTCCAGCTT TCGATAAAAG TGCATTTACT AATTTAAAGC AATTGCCTTT CTTTTACTAT TCTGATAGTC 
19260 19270 19280 19290 19300 19310 19320 

>< Plel SfaNI >< 

>< Nlalll >< Maell 

>< BsmAI BsaAI >< 

X HinflX Alw26I AflHI >< 

CTTGTGAGTC TCATGGCAAA CAAGTAGTGT CGGATATTGA TTATGTTCCA CTCAAATCTG CTACGTGTAT 
19330 19340 19350 19360 19370 19380 19390 

Zsp2I > 
X Seal 

PpulOI >< 
>< RsalNsil > 
Mphll03I > 
X SfaNIEcoT22I > 
> < Rsal >< Csp6I 
X Csp6I Avalll >< 

x NlaIII> < Afal >< Afal 
TACACGATGC AATTTAGGTG GTGCTGTTTG CAGACACCAT GCAAATGAGT ACCGACAGTA CTTGGATGCA 
19400 19410 19420 19430 19440 19450 19460 

X Fokl 

TATAATATGA TGATTTCTGC TGGATTTAGC CTATGGATTT ACAAACAATT TGATACTTAT AACCTGTGGA 
19470 19480 19490 19500 19510 19520 19530 

X ScrFI 

X Mval 
>< Maelll 
>< EcoRII 

X Ecll36I 
X DsaV 

X BstOI 

X BstNI 

X BsiLI >< Tru9I 

x Apyl >< Msel 

ATACATTTAC CAGGTTACAG AGTTTAGAAA ATGTGGCTTA TAATGTTGTT AATAAAGGAC ACTTTGATGG 
19540 19550 19560 19570 19580 19590 19600 

>< SgrAI 
>< Nael 

X Mspl > < Vspl 

x Hpall > < Tru9I 

>< HapII > < Msel 

x CfrrlOI > < Asnl 

x BspWI > < Asel 

ACACGCCGGC GAAGCACCTG TTTCCATCAT TAATAATGCT GTTTACACAA AG G T AG AT GG TATTGATGTG 

19610 19620 19630 -19640 19650 19660 19670 

FIGURE 13. 4 5 
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>< XhoII 
>< Sau3AI 
>< Ndell 
>< Mfll 
X Mbol 
X DpnII 

X Dpnl 
>< BstYI 
>< BspAI 

>< Bspl43I 
>< Bglll 

GAGATCTTTG AAAATAAGAC AACACTTCCT 
19680 19690 19700 



X Tru9I 
>< Msel 
GTTAATGTTG 
19710 



>< Alul 



>< Maelll 
X Espl 

>< DdeITru9I >< 
>< CelllMsel >< 
>< Bpull02I 



CATTTGAGCT 
19720 



TTGGGCTAAG 
19730 



CGTAACATTA 
19740 



>< Fnu4HI 

>< Tru9I >< EcoRV 

>< BsrI >< Msel >< Bbvl >< Eco32I 

AACCAGTGCC AGAGATTAAG ATACTCAATA ATTTGGGTGT TGATATCGCT GCTAATACTG TAATCTGGGA 
19750 19760 19770 19780 19790 19800 19810 

>< Nspl 
>< NspHI 
>< Nlalll 
>< Bsgl 
X Aflltl 

C T AC AAAAGA GAAGCCCCAG CACATGTATC TACAATAGGT GTCTGCACAA TGACTGACAT TGCCAAGAAA 
19820 19830 19840 19850 19860 19870 19880 

X Ddelx Mbol I >< AccI 

CCTACTGAGA GTGCTTGTTC TTCACTTACT GTCTTGTTTG ATGGTAGAGT GGAAGGACAG GTAGACCTTT 
19890 19900 19910 19920 19930 19940 19950 

SinI x 
Sau96I X 
NspIV X 
NspHII X 
NlalV >< 
Eco47I X 
Cfrl3I X 

X BslI 
BsiZI X 

X BsiYI 
BscBI X 
Bmel8I >< 

x Tru9I Avail >< 

X Msel Asul X 

TTAGAAACGC CCGTAATGGT GTTTTAATAA CAGAAGGTTC AGTCAAAGGT CTAACACCTT CAAAGGGACC 
19960 19970 19980 19990 20000 20010 20020 



X Rmal 
' x Nhel 
x Mael 
X Hgaix Alul 



X Vspl 
X Tru9I 
Plel 



x 
>< Msel 
>< Maelll 

>< Asnl 
X HinfIX Asel 



Tru9I X 
X Tru9I 

MseX X 
x Msel 



>< Tfil 
x Hinfl 

AGCACAAGCT AGCGTCAATG GAGTCACATT AATTGGAGAA TCAGTAAAAA CACAGTTTAA CTACTTTAAG 
20030 20040 20050 20060 20070 20080 20090 



X DdeT X Mnll Tru9I X 
>< BsmAI >< Ddel 



FIGURE 13.46 
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>< AccI >< Alw26I >< BfrlMsel >< 

AAAGTAGACG GCATTATTCA ACAGTTGCCT GAAACCTACT TTACTCAGAG CAGAGACTTA GAGGATTTTA 

20100 20110 20120 20130 20140 20150 20160 

>< TthHB8 I 
>< Taql 

>< SstI 

>< Sdul Xhol >< 

>< Sad TthHB8l > 

> < PaeR7l Taq i > 

> < NspIII Slal >< 

>< NspII PaeR7I >< 

>< HgiAI NspIII >< 

> < Eco88I >< Mnll 

> < XholX Eco24I Eco88I >< 
>< Ecll36II Ccrl x 

> < Slalx Bspl286I BspWI >< 

> < Ccrlx Bmyl Bcol >< 

> < Bcolx Banll > < Bcgl/a 

> < Ama87I Aval X 

> < Avalx Alw21I Ama87I >< 
X Alul X EcoRI X FoklAluI X 

AGCCCAGATC ACAAATGGAA ACTGACTTTC TCGAGCTCGC TATGGATGAA TTCATACAGC GATATAAGCT 

20170 20180 20190 20200 20210 20220 20230 



>< Xcml 
>< Sau3AI 
X Ndell 
>< Mbol 
>< Dpall 

X Dpnl 
>< BspAI 

X Bspl43I 



X TthHB8 I 
X Taql 
>< Sful 
X NspV 
X Lspl 
>< Csp45I 
X BstBI 
X Bspll9I 

>< BsiCI >< MboII 

X Bpul4I >< Bbsl Tru9I X 

>< AsuII >< Bcgl X Nlalll X AcilMsel X 

CGAGGGCTAT GCCTTCGAAC AC ATCGTT T A TGGAGATTTC AGTCATGGAC AACTTGGCGG TCTTCATTTA 
20240 20250 20260 20270 20280 20290 20300 



X Espl 
>< Ddel 
>< Celll X 
X Bpull02I > 
>< Bfrl 



x HphI 
x HinPlI 
>< Hin6I 

> < Hhal >< Tfil 
>< Haell 
Eco47III 
< Cfol X Hinfl 



X Bspl43II 



>< Tru9I 
X Msel 
x Mnll 



ATGATAGGCT TAGCCAAGCG CTCACAAGAT TCACCACTTA AATTAGAGGA TTTTATCCCT AT GG AC AG C A 



20310 



20320 



20330 



20340 



20350 



20360 



20370 



x SfaNI 



>< MstI 
X HinPlI 
X Hin6I 
>< Hhal 
>< Espl 
X Fdill 
X Cfol 
x Avill 



Sau3AI X 
Ndell X 
Mbol X 
DpnII X 

DpnT >< 
BspAI X 
Bspl43I X 



CAGTGAAAAA T TACT T CAT A AC AG AT GC G C AAACAGGTTC ATCAAAATGT GTGTGTTCTG TGATTGATCT 
20380 20390 20400 20410 20420 20430 20440 



X TthHB8 I 
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>< Tthllll 
>< TaqI 

>< Aspl > < Maelll Maelll >< 

TTTACTTGAT GACTTTGTCG AGATAATAAA GTCACAAGAT TTGTCAGTGA TTTCAAAAGT GGTCAAGGTT 
20450 20460 20470 20480 20490 20500 20510 



>< Muni > 
ACAATTGACT ATGCTGAAAT TTCATTCATG 



20520 



20530 



20540 



>< Nspl 
X NspHI 
>< Nlalll 
>< Fokl 

< Niairr >< Afiin . 

CTTTGGTGTA AGGATGGACA TGTTGAAACC TTCTACCCAA 
20550 20560 20570 20580 



X SfaNI 

X ScrFI 

>< Mval 
X EcoRII 

>< Ecll36I 
X DsaV 

>< BstOI >< SfaNI 

>< BstNI >< Rsal BspWI >< 

>< BsiLI > < Csp6I BsmI > 

>< BspWI >< Apyl >< Afal BscCI >< 

AACTACAAGC AAGTCAAGCG TGGCAACCAG GTGTTGCGAT GCCTAACTTG TACAAGATGC AAAGAATGCT 
20590 20600 20610 20620 20630 20640 20650 



>< Eco57I >< Maelll >< HphI 

TCTTGAAAAG TGTGACCTTC AGAATTATGG TGAAAATGCT GTTATACCAA AAGGAATAAT GATGAATGTC 
20660 20670 20680 20690 20700 20710 20720 

> < Rsal 
>< Csp6I 

>< Bstll07I >< Tru9I >< Alul 

>< AccI >< Msel > < AfalNlalll >< 

GCAAAGTATA CTCAACTGTG TCAATACTTA AATACACTTA CTTTAGCTGT ACCCTACAAC ATGAGAGTTA 
20730 20740 20750 20760 20770 20780 20790 



>< ScrFI 

>< Rsal 
>< Mval 
>< EcoRII >< NspBII 

>< Ecll36I >< Sdul 

> < Csp6I >< NspII 

>< BstOI >< Pvuirx HgiAI 
>< BstNI >< Ddel 

>< BsiLI >< Psp5I>< Bspl286I 
>< Apyl >< Alul >< Bmyl 
>< DsaVX Afal >< Alw21I 

TTCACTTTGG TGCTGGCTCT GATAAAGGAG TTGCACCAGG TACAGCTGTG CTCAGACAAT GGTTGCCAAC 
20800 20810 20820 208 30 20840 20850 208 60 



>< XhoII 

X Tru9I 
X Sau3AI 
X Ndell 
X TthHB8I X Msel 
X Mfll 
X Mbol 
>< MamI 
X DpnII 
X Tfil >< Dpnl 
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>< BstYI 
>< BspAI 
>< Hinfix Bspl43l 

>< BsiBI 

>< BsaBI 



> < Tfil 

> < Hinfl 

>< Esp3I >< Tru9I 

>< Tthllll >< BsraBI >< Msel 

X BsmAI > < BsmAI 



X BsrI >< TaqI >< Bglll >< Aspl >< Alw26I >< Hgal> < Alw26I 

TGGCACACTA CTTGTCGATT CAGATCTTAA TGACTTCGTC TCCGACGCAG ATTCTACTTT AATTGGAGAC 
20870 20880 20890 20900 20910 20920 20930 



>< Rsal 
> < Csp6I 
>< Afal 



< SinI 

< Sau96I 

>< PssI 
>< PspSII 

< PpuMI 

< NspIV 
>< NspHII 
>< NlalV 

< Eco0109I 

< Eco47I 

< Drall 

< Cfrl3I 

< BsiZI 
>< BscBI 

< Bmel8I 

< Avail 

< Asul 



TGTGCAACAG TACATACGGC TAATAAATGG GACCTTATTA 
20940 20950 20960 20970 



X Styl 

X SinI 
>< Sau96I 
>< Rraal 

>< NspIV 
NspHII X 
X Mae I 

>< EcoTl4I 

>< Eco4 7l 

>< Ecol30I 

>< Cfrl3I 

>< BssTlI 

>< BsiZI 

>< BsaJI 

>< Bmel8I 

>< Blnl 

X Avrll 

>< Avail 
X Asul 
AflHI >< 

TTAGCGATAT GTATGACCCT AGGACCAAAC 
20980 20990 21000 



X Nspl 
X NspHI 

x Nlalll >< Plel >< 

x Maelll X Hinfl MaeI >< 

ATGTGACAAA AGAGAATGAC TCTAAAGAAG GGTTTTTCAC TTATCTGTGT GGATTTATAA AGCAAAAACT 

21010 21020 21030 21040 21050 21060 21070 



X ScrFI 
X Mval 
X EcoRII 

x EC1136I 
x DsaV 
x BsfcOI 
>< BstNI 
X BsiLI 
>< BsaJI 
>< BsaJI 
>< Apyl 



>< 



Sau96I 
NspIV 
Cfrl3I 
BsiZI 
Asul 



Sfcl >< BsmI X Bsnvl 

> < Alul >< BscCI >< BscCIHindlll XX Alul 

AGCCCTGGGT GGTTCTATAG CTGTAAAGAT AACAGAGCAT TCTTGGAATG CTGACCTTTA CAAGCTTATG 

21080 21090 21100 21110 21120 21130 21140 



X Zsp2I 
X PpulOI 

>< Pall >< NsiI 

X Haelll >< Mphll03I 

X BsuRI >< Maelll >< EcoT22I 

X BshI >< NlalllX Alul >< Bcgl >< Avalll X SfaNIBcgl/a X 

GGCCATTTCT CATGGTGGAC AGCTTTTGTT ACAAATGTAA ATGCATCATC ATCGGAAGCA TTTTTAATTG 
21150 21160 21170 21180 21190 21200 21210 



Tru9I >< 

>< Msel 



FIGURE 13.4 9 



WO 2005/056584 



63/llb 



PCT/FR2004/003106 



>< Zsp2I 
>< Sphl 
>< PpulOI 

>< Pael 
>< Nspl 
>< NspHI 

>< Nsil 

X Nlalll 

> < Nlalll 

>< Mphll03I 
>< EcoT22I 

> <. Avalll >< Mnll 
GGGCTAACTA TCTTGGCAAG CCGAAGGAAC AAATTGATGG CTATACCATG CATGCTAACT ACATTTTCTG 

21220 21230 21240 21250 21260 21270 21280 

Tru9I X 

X MboII >< Tru9I 

>< Gsul Msel >< 

>< BsrI >< Msel 

>< Bpml Mnll >< 

>< Bbsl >< Nlalll >< Mnll 

GAGGAACACA AATCCTATCC AGTTGTCTTC CTATTCACTC TTTGACATGA GCAAATTTCC TCTTAAATTA 
21290 21300 21310 21320 21330 21340 21350 

>< Tru9I 
>< Msel 
>< Esp4I> < Tfil 
>< BsmAI Ksp632I >< 

>< Alw26I >< MboII >< Earl 

>< AflII> < Hinfl Eamll04I >< 

AGAGGAACTG CTGTAATGTC TCTTAAGGAG AATCAAATCA ATGATATGAT TTATTCTCTT CTGGAAAAAG 
21360 21370 21380 21390 21400 21410 21420 

>< Tru9I 
>< Msel 
>< Hindll 
>< Hindi 
>< Hpal Afllll > 

GTAGGCTTAT CATTAGAGAA AACAACAGAG TTGTGGTTTC AAGTGATATT CTTGTTAACA ACTAAACGAA 
21430 21440 21450 21460 21470 21480 21490 

>< Vnel 
>< Snol 

>< Sdul 
>< NspII 
>< Hpal I 

X HgiAI 
X HapII 
X CfrlOI 

x Bspl286I 
X MsplX Bmyl 

>< Nspl X Spel X ApaLI 

X NspHI x Rmal X Alw4 4I 

X Nlalll >< Mael >< Maelll X Agel x Aiw21I 

CATGTTTATT TTCTTATTAT TTCTTACTCT CACTAGTGGT AGTGACCTTG ACCGGTGCAC CACTTTTGAT 
21500 21510 21520 21530 21540 21550 21560 

> < Alul X Mnll 

GATGTTCAAG CTCCTAATTA CACTCAACAT ACTTCATCTA TGAGGGGGGT TTACTATCCT GATGAAATTT 
21570 21580 21590 21600 21610 21620 21630 

x Sau3AI 
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>< Ndell 
X Mbol 
>< DpnII 

X Dpnl >< Tru9I 

>< BspAI >< Msel > < MboII 

>< Bspl43I >< Ddel >< Maelll 

TTAGATCAGA CACTCTTTAT TTAACTCAGG ATTTATTTCT TCCATTTTAT TCTAATGTTA CAGGGTTTCA 
21640 21650 21660 21670 21680 21690 21700 



>< Vspl 
>< Tru9I 
>< Msel 

>< Asnl >< Tru9I >< Fokl 

>< Asel >< Maell >< Msel >< Bbvl > < Fnu4HI 

TACTATTAAT CATACGTTTG GCAACCCTGT CATACCTTTT AAGGATGGTA TTTATTTTGC TGCCACAGAG 
21710 21720 21730 21740 21750 21760 21770 



>< BslI 

>< DsalX BsiYI >< Nlalll 

>< BsaJI > < Maelll 

AAATCAAATG TTGTCCGTGG TTGGGTTTTT GGTTCTACCA TGAACAACAA GTCACAGTCG GTG AT TATTA 
21780 21790 21800 21810 21820 21830 21840 



>< Nspl 

>< Tru9I >< NspHI 

>< Msel >< Nlalll 

>< HphI >< Maelll >< Maelll 

TTAACAATTC TACTAATGTT GTTATACGAG CATGTAACTT TGAATTGTGT G AC AACCCT T TCTTTGCTGT 

21850 21860 21870 21880 21890 21900 21910 

>< Styl >< Zsp2I 

>< Nlalll >< Tru9I 

>< Ncol >< Rsal >< PpulOI TthHB8 I >< 

>< EcoT14I >< Nsil >< TaqI 

>< Ecol30I X Msel SfaNI X 

>< Dsalx Csp6I >< Mphll03I Rsal x 

X BssTlI X TthHB8I X EcoT22I Csp6I X 

x BsaJIx Afal >< TaqI x Avalll Afal x 

TTCTAAACCC ATGGGTACAC AG AC AC AT AC TATGATATTC GATAATGCAT TTAATTGCAC TTTCGAGTAC 

21920 21930 21940 21950 21960 21970 21980 



>< Tru9I 
X Msel 
X DraT 

ATATCTGATG CCTTTTCGCT TGATGTTTCA GAAAAGTCAG GTAATTTTAA ACACTTACGA GAGTTTGTGT 
21990 22000 22010 22020 22030 22040 22050 

>< Sau3AI 
X Ndell 
X Mbol 
X DpnII 

X Tru9I x Dpnl 

>< Msel X BspAI 

>< Dral >< Sfcl Bspl43I X 

TTAAAAATAA AGATGGGTTT CTCTATGTTT ATAAGGGCTA TCAACCTATA GATGTAGTTC GTGATCTACC 
22060 22070 22080 22090 22100 22110 22120 



X Tru9I 

>< Tru9I > < Tru9I >< Msel 

X Msel > < Msel X Mnll 

TTCTGGTTTT AACACTTTGA AACCTATTTT TAAGTTGCCT CTTGGTATTA AC ATT AC AAA TTTTAGAGCC 
22130 22140 22150 22160 22170 22180 22190 
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> < SduIX Sfcl 

X PvuII 
X PspSI 

> < NspII 

>< NspBII 

> < Maell > < Fnu4HI 

> < Bspl286I >< PstI Tru9l > 
>< BspMI > < BmylX Fnu4HI Msel > 

>< HphI >< Bbvl >< Alul >< Bbvl 

ATTCTTACAG CCTTTTCACC TGCTCAAGAC ATTTGGGGCA CGTCAGCTGC AGCCTATTTT GTTGGCTATT 
22200 22210 22220 22230 22240 22250 22260 

X SfaNI 
>< Rsal 

> < Csp6I 

>< Dral >< Afal >< AlwNI 

TAAAGCCAAC TACATTTATG CTCAAGTATG AT GAAAATGG TACAATCACA GATGCTGTTG ATTGTTCTCA 
22270 22280 22290 22300 22310 22320 22330 

> < Tru9I 

> < Msel 

>< Alul 

AAATCCACTT GCTGAACTCA AATGCTCTGT TAAGAGCTTT GAGATTGACA AAGGAATTTA CCAGACCTCT 
22340 22350 22360 22370 22380 22390 22400 

>< Saul 
X Mstll 
>< Eco81I 
>< Ddel 
>< Cvnl 
>< Bsu36I 
>< Bse21I 

>< Axyl >< Tfil 

>< Mnll >< AocI >< Mnll >< Hinfl >< Sspl >< Mnll 

AATTT CAGGG TTGTTCCCTC AGGAGATGTT GTGAGATTCC CTAATATTAC AAACTTGTGT CCTTTTGGAG 
22410 22420 22430 22440 22450 22460 22470 

>< Zsp2I 
>< PpulOI 

>< Nsil 

> < Nlalll 
>< Mphll03l 

>< Tru9I * >< EcoT22I 

x Msel >< Avalll 

AGGTTTTTAA TGCTACTAAA TTCCCTTCTG TCTATGCATG GGAGAGAAAA AAAATTTCTA ATTGTGTTGC 
22480 22490 22500 22510 22520 22530 22540 

X Sdul 
X NspII 
X HgiAI 
X Bspl286I 

X Bmyl >< Tru9I 

X ALw21I >< Msel Ddel X 

TGATTACTCT GTGCTCTACA ACTCAACATT TTTTTCAACC TTTAAGTGCT ATGGCGTTTC TGCCACTAAG 
22550 22560 22570 22580 22590 22600 22610 

>< Sau3AI 
X Ndell 
X Mbol 
X DpnII 
X Dpnl 

FIGURE 1352 
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>< BspAI >< xfiI 

>< Bspl43I >< Hinfl 

TTGAATGATC TTTGCTTCTC CAATGTCTAT GCAGATTCTT TTGTAGTCAA GGGAGATGAT GTAAGACAAA 
22620 22630 22640 22650 22660 22670 22680 

>< ScrFI 
>< Mval 
>< HinPlI 
>< Hin6I 
>< Hhal 

>< Haell 
>< EcoRII 

>< Ecll36I 
>< DsaV 
>< Cfol 

>< Bstor 

>< BstNI 
>< Bspl43II 
X BsiLI 

>< Apyl > < BsrI >< Nlalll 

TAGCGCCAGG ACAAACTGGT GTTATTGCTG ATTATAATTA TAAATTGCCA GATGATTTCA TGGGTTGTGT 
22690 22700 22710 22720 22730 22740 22750 

>< SfaNI 

>< Rmal Ddel >< 

>< Mael >< BsrI Bfrl >< 

CCTTGCTTGG AATACTAGGA ACATTGATGC TACTTCAACT GGTAATTATA ATTATAAATA TAGGTATCTT 

22760 22770 22780 22790 22800 22810 22820 



>< Sau96I 

>< Pall 
>< NspIV 
> < Hindlll 

>< Haelll 
X EcoO109I 
>< Drari 
Ddel 
>< Cfrl3I 
>< BsuRI 
>< BsiZI 
>< BshI 
Bfrl >< BssI 
X Asulx BsraAI 

X Alul >< Alw26l BspWI >< 

AG AC AT GGC A AGCTTAGGCC CTTTGAGAGA GACATATCTA ATGTGCCTTT CTCCCCTGAT GGCAAACCTT 



>< 



>< 

>< Nlalll 



22830 



22840 



22850 



22860 



22870 



22880 



22890 



>< Tru9I 
>< Pall 
>< MscI 
>< Haelll 
>< Eaeix Msel 
>< Tru9I >< BsuRI 

>< Msel >< BshI 

X BspMI X Ball BsrI X 

GCACCCCACC TGCTCTTAAT TGTTATTGGC CAT T AAATG A TTATGGTTTT TACACCACTA CTGGCATTGG 
22900 22910 22920 22930 22940 22950 22960 



Sau96I >< 
>< PallNspIV >< 
> < Mspr NspHII X 
>< Haelll 
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> < Hpall Eco47l >< 

>< Dsal 

> < HapII Cfrl3X >< 

>< BsuRISinI >< 
>< Gdill BsiZI >< 
>< Seal >< BsaJI 

>< Rsal >< Tru9I >< Eael BmelBI >< 

>< Csp6I >< Msel >< CfrlOI Avail >< 

>< Afal >< Dral >< BshI Asul >< 

CTACCAACCT TACAGAGTTG TAGTACTTTC TTTTGAACTT TTAAATGCAC CGGCCACGGT TTGTGGACCA 
22970 22980 22990 23000 23010 23020 23030 

>< Tru9I >< Rsal 

>< Tru9I >< Csp6I 

>< Plel BsrI >< 

> < Tru9I >< Msel >< BsrI 

> < Mseix BsrI >< Msel >< Hinfl >< Afal 
AAATTATCCA CTGACCTTAT TAAGAACCAG TGTGTCAATT TTAATTTTAA TGGACTCACT GGTACTGGTG 

23040 23050 23060 23070 23080 23090 23100 

X Tru9I >< Pall 

>< Msel >< Haelll 

>< MboII >< Gdill 

>< Hpal >< Eael 

X Hindll >< BsuRI Tfil >< 

X Hindi >< BshI Hinfl x 
TGTTAACTCC TTCTTCAAAG AGATTTCAAC C ATT T C AAC A ATTTGGCCGT GATGTTTCTG ATTTCACTGA 

23110 23120 23130 23140 23150 23160 23170 

> < XhoII 
X TthHB8 I 
X TaqI 

> < Sau3AI 

> < Ndell 

> < Mfll 

> < Mbol 

> < DpnII 

x Dpnl 

> < BstYI 

> < BspAI > < Sspl 

X AIwI X Bspl43I >< HphI 

TTCCGTTCGA GATCCTAAAA CATCTGAAAT ATTAGACATT TCACCTTGCT CTTTTGGGGG TGTAAGTGTA 
23180 23190 23200 23210 23220 23230 23240 

X ScrFI 
X Mval 
X EcoRII 

X Ecll36I >< Tru9I 

X DsaV >< Msel 

X BstOI X H P aI 

X BstNI >< Hindll 

X BsiLI >< Eco57I 

x Apyl ><c Bsgl >< Hindi 

ATTACACCTG GAACAAATGC TTCATCTGAA GTTGCTGTTC TATATCAAGA TGTTAACTGC ACTGATGTTT 
23250 23260 23270 23280 23290 23300 23310 

X Sau3AI 
>< Nlalll 
X Ndell 
X Mbol 
X DpnII 

x Dpnl >< HinPlI 
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>< BspWI >< Hin6I 

>< BspAI > < Hhal Plel >< 

>< Sfcl >< Bspl43I >< Alul> < Cfol >< BsrI 

CTACAGCAAT TCATGCAGAT CAACTCACAC CAGCTTGGCG CATATATTCT ACTGGAAACA ATGTATTCCA 
23320 23330 23340 23350 23360 23370 23380 



>< TthHB8I 
X TaqI 
>< Sail 
>< Rtrl 
>< Nspl 
>< Espl >< NspHI 
>< Dclel >< Nlalll 
>< Celll >< Hindll 
>< Bpull02I>< Hindi 
>< Hinfl >< Alul >< AccI 

GACTCAAGCA GGCTGTCTTA TAGGAGCTGA GCATGTCGAC ACTTCTTATG AGTGCGACAT TCCTATTGGA 
23390 23400 23410 23420 23430 23440 23450 

> < SnaBI 

>< Seal 
>< Rsal 
>< Rmal 
>< Maell >< Mael 

> < Ecol05I 
X Rmal >< Csp6I 

>< Mael II > < BsaAI 

>< Alul >< Mael >< Afal 

GCTGGCATTT GTGCTAGTTA CCATACAGTT TCTTTATTAC GTAGTACTAG CCAAAAATCT ATTGTGGCTT 

23460 23470 23480 23490 23500 23510 23520 



>< Muni 

ATACTATGTC TTTAGGTGCT GATAGTTCAA TTGCTTACTC TAATAACACC ATTGCTATAC CTACTAACTT 
23530 23540 23550 23560 23570 23580 23590 

Rsal >< 
>< Mnll 

Csp6I X 

>< Sfcl Af al >< 

TTCAATTAGC ATTACTACAG AAGTAATGCC TGTTTCTATG GCTAAAACCT CCGTAGATTG TAATATGTAC 
23600 23610 23620 23630 23640 23650 23660 



> < Tfil 

> < Hinfl 

X Acil > < A lu! 

ATCTGCGGAG ATTCTACTGA ATGTGCTAAT TTGCTTCTCC AATATGGTAG CTTTTGCACA CAACTAAATC 
23670 23680 23690 23700 23710 23720 23730 



>< Vnel 



>< Sdul 








>< NspII 








>< HgiAI 






>< Pmll 


Snoix Ddel 


>< 


Sau3AI 


>< PmaCI 


>< Bspl286I 


>< 


Ndell 


>< Maell 


>< Bmyl 


>< 


Mbol 


>< Eco72I 


>< Bbvl 




>< Dpnl 


>< BsaAI 



>< ApaLI >< Bspl4 3I >< BbrPI 

>< Alw4 4I >< DpnII >< Alwl 

X Alw21I >< Fnu4HI X BspAI X Afllll 

GTGCACTCTC AGGTATTGCT GCTGAACAGG ATCGCAACAC ACGTGAAGTG TTCGCTCAAG TCAAACAAAT 
23740 23750 23760 23770 23780 23790 23800 
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>< Rsal 

X Csp6I >< Tru9I 

X Afal >< Sspl >< Msel >< Sspl 

GTACAAAACC CCAACTTTGA AATATTTTGG TGGTTTTAAT TTTTCACAAA TATTACCTGA CCCTCTAAAG 
23810 23820 23830 23840 23850 23860 23870 

>< Mnll 

>< Mnll >< Tru9I >< SfaNI >< HphI Nlalll X 

>< Ddel ■>< Mnll >< Msel >< Maelll BspHI >< 

CCAACTAAGA GGTCTTTTAT TGAGGACTTG CTCTTTAATA AGGTGACACT CGCTGATGCT GGCTTCATGA 
23880 23890 23900 23910 23920 23930 23940 



>< 



>< Styl 
>< Rraal 
>< Mae I 
>< EcoT14I 
>< Ecol30I 
>< BssTlI 

>< Bsml 
BscCI 
>< BsaJI 
>< Blnl 
>< Avrll 



>< 

>< 
>< 
>< 
>< 



>< XhoII 
>< Sau3AI 
>< Rmal 

X Ndell 
>< Mfll 
>< Mbol 
>< Mael 
Vspl >< DpnII 

>< Hphl> < Dpnl 
Tru9I X BstYI 
Msel >< BspAI 
Asnl > < Bspl4 3I 

Asel X Bglll 



AGCAATATGG CGAATGCCTA GGTGATATTA ATGCTAGAGA TCTCATTTGT 
23950 23960 23970 23980 23990 



>< MstI 
>< HinPlI 
>< Hin6I 
>< Hhal 
>< Fspl 
>< Fdill 
>< Cfol 
>< Avill 
GCGCAGAAGT TCAATGGACT 
24000 24010 



>< RmalRsal >< 
>< Mnll >< Fnu4HI >< Fnu4HI Csp6I X 

>< BspWI >< Bbvl >< Bbvl >< BspWI X MaelAfal >< 

TACAGTGTTG CCACCTCTGC TCACTGATGA TATGATTGCT GCCTACACTG CTGCTCTAGT TAGTGGTACT 
24020 24030 24040 24050 24060 24070 24080 



>< Mbol I 
>< HinPlI 
>< Hin6I 
>< Hhal 
>< Haell 

>< Fnu4HI >< Ksp632I 
>< Cfol >< Earl 
>< BspWI >< Eaml 104-1 
>< Bspl43II 

GCCACTGCTG GATGGACATT TGGTGCTGGC GCTGCTCTTC AAATACCTTT TGCTATGCAA ATGGCATATA 
24090 24100 24110 24120 24130 24140 24150 



>< Fokl 
>< Bbvl 



Tru9I >< 

>< Maelll Msel >< 

GGTTCAATGG CATTGGAGTT ACCCAAAATG TTCTCTATGA GAACCAAAAA CAAATCGCCA ACCAATTTAA 
24160 24170 24180 24190 24200 24210 24220 

Mae II >< 

>< Tfil >< Fnu4HI 

>< Hinfl >< Bbvl >< Alul 

CAAGGCGATT AGTCAAATTC AAGAATCACT TACAACAACA TCAACTGCAT TGGGCAAGCT GCAAGACGTT 
24230 24240 24250 24260 24270 24280 24290 



X Tru9I 
X Msel 
X Hpal 

>< Hindll x Bsml x Tru9I 
X Hincllx BscCI >< Msel 



X Ddel 
x Tru9I x Bfrl 
X Msel X Alul 
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GTTAACCAGA ATGCTCAAGC ATTAAACACA CTTGTTAAAC AACTTAGCTC TAATTTTGGT GCAATTTCAA 
24300 24310 24320 24330 24340 24350 24360 

>< Thai 
>< Spol 
>< Nrul 
>< Mvnl 

>< BstUI >< TthHB8I 

>< Bsp68I >< TaqI >< Rsal 

>< EcoRV >< BspSOI >< Mnll >< Csp6I >< Tru9I 

>< Eco32I >< AccII >< Mnll >< Aciix Afal >< Msel 

GTGTGCTAAA TGATATCCTT TCGCGACTTG ATAAAGTCGA GGCGGAGGTA CAAATTGACA GGTTAATTAC 
24370 24380 24390 24400 24410 24420 24430 

X Maelll >< Bbvl >< Fnu4HI Bbvl >< 

AGGCAGACTT CAAAGCCTTC AAACCTATGT AACACAACAA CTAATCAGGG CTGCTGAAAT CAGGGCTTCT 
24440 24450 24460 24470 24480 24490 24500 

X Fnu4HI >< "Hindll 

X BspWI >< Ddel >< Hindi 

GCTAATCTTG CTGCTACTAA AATGTCTGAG TGTGTTCTTG GACAATCAAA AAGAGTTGAC TTTTGTGGAA 
24510 24520 24530 24540 24550 24560 24570 

> < Nspl 

> < NspHI 

> < Nlalll 
>< Maelll 

>< Nlalll >< Maell 

>< MboII >< Fokl 

>< Fnu4HI >< Bbsl BsaAI >< 

>< Aciix Bbvl x Afllll 

AGGGCTACCA CCTTATGTCC TTCCCACAAG CAGCCCCGCA TGGTGTTGTC TTCCTACATG TCACGTATGT 

24580 24590 24600 24610 24620 24630 24640 

>< ScrFI 
X Mval 
X EcoRII 
X Ecll36I 
X BstOI 

X BstNI >< HinPlI 

X Mnll >< BslI >< Hin6I 

X DsaVX BsiYI >< Hhal 

X BsiLI >< Haell 

>< BsaJIx HphI >< Cfol >< Nlalll 

X Apyl >< Bspl4 3II X BspHI EcoNI X 

GCCATCCCAG GAGAGGAACT TCACCACAGC GCCAGCAATT TGTCATGAAG GCAAAGCATA CTTCCCTCGT 
24650 24660 24670 24680 24690 24700 24710 

X Mnll 
X BslI >< Tru9I 

X BsiYI >< Msel >< Mnll 

GAAGGTGTTT TTGTGTTTAA TGGCACTTCT TGGTTTATTA CACAGAGGAA CTTCTTTTCT CCACAAATAA 
24720 24730 24740 24750 24760 24770 24780 

X Ddel >< Tru9I 

X BsmAI >< SfaNI 

>< sfcl >< Alw26I >< MselAlwI X 

TTACTACAGA CAATACATTT GTCTCAGGAA ATTGTGATGT CGTTATTGGC ATCATTAACA ACACAGTTTA 
24790 24800 ' 24810 24820 24830 24840 24850 



>< Sau3AI 
X Ndell 
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>< Mbol 
>< DpnII 

>< Dpnl 
>< BspAI 

>< Bspl43l 

TGATCCTCTG CAACCTGAGC TTGACTCATT CAAAGAAGAG 
24860 24870 24880 24890 



>< Plel 
>< Mnll 
>< Ddel >< 
>< BspWI 
>< Alul 



> 

Hinfl 

> 
> 
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> < Seal 

> < Rsal 
>< MboII 

>< Csp6I 
< Alul > < Afal > < HphI 
CTGGACAAGT ACTTCAAAAA TCATACATCA 
24900 24910 24920 



>< Sau3AI 
>< Ndell 
>< Mbol 
>< Mam I 
>< DpnII 

>< Dpnl 
>< BspAI 

>< BspL43I 

>< BsiBI >< Tru9I >< Hindll 

X BsaBI >< Msel >< Hindi Acil >< 

CCAGATGTTG ATCTTGGCGA CATTTCAGGC ATTAACGCTT CTGTCGTCAA C ATT CAAAAA GAAATTGACC 
24930 24940 24950 24960 24970 24980 24990 



>< Tru9I 

> < Tfil 
>< Mnll >< Swal 

>< EcoNI >< Msel 

>< BslI > < Hinfl 

>< Mnlix BsiYI >< Dral 

GCCTCAATGA GGTCGCTAAA AATTTAAATG AATCACTCAT TGACCTTCAA GAATTGGGAA AATATGAGCA 
25000 25010 25020 25030 25040 25050 25060 



X Styl 
x Pall 
>< Haelll 

X EcoT14I 

x Ecol30I 
>< BsuRI 

X BssTlI Nlalll >< 

>< Tru9I>< BshI Maelll >< 

X Msel >< BsaJI > < BstXI 

AT AT AT T AAA TGGCCTTGGT ATGTTTGGCT CGGCTTCATT GCTGGACTAA TTGCCATCGT CATGGTTACA 
25070 25080 25090 25100 25110 25120 25130 

> < SphI 

> < Pael 

x Spel > < Nspl 

> < Rmal > < NspHI 
x Nialll > < Nlalll 

> < Mael >< Mnlix Bbvl Fnu4HI X 
ATCTTGCTTT GTTGCATGAC TAGTTGTTGC AGTTGCCTCA AGGGTGCATG CTCTTGTGGT TCTTGCTGCA 

25140 25150 25160 25170 25180 25190 25200 



X Fokl 
X Ddel 

x Mnll x Pleix Hinfl >< BsrI 

AGTTTGATGA GGATGACTCT GAGCCAGTTC TCAAGGGTGT CAAATTACAT TACACATAAA CGAACTTATG 
25210 25220 25230 25240 25250 25260 25270 



>< Sau3AI 
X Ndell 
X Mbol 
X DpnII 
> < Dpnl 
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>< BspAI 

> < Bspl43l 

>< Bsgl >< Alwl >< BsrI BspWI > 

GATTTGTTTA TGAGATTTTT TACTCTTGGA TCAATTACTG CACAGCCAGT AAAAATTGAC AATGCTTCTC 
25280 25290 25300 25310 25320 25330 25340 



>< Seal 
x Rsal 
X Csp6I >< Sfcl 

>< Afal >< Nlalll X Acil >< Mnll Fokl > 

CTGCAAGTAC TGTTCATGCT ACAGCAACGA TACCGCTACA AGCCTCACTC CCTTTCGGAT GGCTTGTTAT 



25350 



25360 



25370 



25380 



25390 



25400 



25410 



>< BspWI 



> < HinPlI 

> < Hin6l 

>< Hhal 
>< Haell 
>< Eco47III 
>< Cfol 
>< Bspl43II 



>< HinPlI 
>< Hin6I 
>< Hhal 
>< Cfol 



Rmal >< 
Nhel >< 
Mael >< 
Fnu4HI >< 

Alul >< 



TGGCGTTGCA TTTCTTGCTG TTTTTCAGAG CGCTACCAAA ATAATTGCGC TCAATAAAAG ATGGCAGCTA 



25420 



25430 



25440 



25450 



25460 



25470 



25480 



>< EcoNI 
>< BslI 

>< BsiYI >< Maelll 

>< Bbvl >< BsrI >< Bbvl > < Fnu4HI Bbvl >< 

GCCCTTTATA AGGGCTTCCA GTTCATTTGC AATTTACTGC TGCTATTTGT TACCATCTAT TCACATCTTT 
25490 25500 25510 25520 25530 25540 25550 

Zsp2I >< 
PpulOI >< 

> < Sfcl >< HinPlI Usxl >< 

X PstI >< Hin6I >< Rsal Mphll03I >< 

> < Fnu4HI >< Hhal >< Csp6I EcoT22I >< 
X BspMI X Mrvll >< Cfol >< Afal >< Mnll Avalll >< 

TGCTTGTCGC TGCAGGTATG GAGGCGCAAT TTTTGTACCT CTATGCCTTG ATATATTTTC TACAATGCAT 
25560 25570 25580 25590 25600 25610 25620 



X SfaNI 
X Nspl 
X NspHI 

X Nlalll >< SCaNI 

CAACGCATGT AGAATTATTA TGAGATGTTG GCTTTGTTGG AAGTGCAAAT CCAAGAACCC ATTACTTTAT 
25630 25640 25650 25660 25670 25680 25690 

>< Bstll07I 
X AccI Maelll >< 

GATGCCAACT ACTTTGTTTG CTGGCACACA CATAACTATG ACTACTGTAT ACCATATAAC AGTGTCACAG 
25700 25710 25720 25730 25740 25750 25760 

>< MboII 

X HphI BstXI X 

X Muni >< Maelll >< Maelll >< Eco57I X Bbsl Mnll > 

ATACAATTGT CGTTACTGAA GGTGACGGCA TTTCAACACC AAAACTCAAA GAAGACTACC AAATTGGTGG 
25770 25780 25790 25800 25810 25820 25830 



X Rsal 

> < Nlalll 
>< HphI 

X Tru9I >< TthllllX Csp6I 
x Ddel >< Ddel >< Mseix Aspl >< Afal 



FIGURE 1359 
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TTATTCTGAG GATAGGCACT CAGGTGTTAA AGACTATGTC GTTGTACATG GCTATTTCAC CGAAGTTTAC 
25840 25850 - 25860 25870 25880 25890 25900 

Tru9I >< 

> < Hinfix Plel >< BsrI Msel >< 

X Alul >< AccI >< Sfcl >< AlwNI >< MboII Hindlll > 

TACCAGCTTG AGTCTACACA AATTACTACA GACACTGGTA TTGAAAATGC TACATTCTTC ATCTTTAACA 
25910 25920 25930 25940 25950 25960 25970 

> < TthHB8I 

>< Tru9I > < TaqI >< Ksp632I 

>< Msel > < MboII >< Earl BspWI >< 

>< Alul >< Eco57I >< Eamll04I Alwl >< 

AGCTTGTTAA AGACCCACCG AATGTGCAAA TACACACAAT CGACGGCTCT TCAGGAGTTG CTAATCCAGC 
25980 25990 26000 26010 26020 26030 26040 

>< XhoII 
X Sau3AI 

X NlalV 
>< Ndell 
>< Mfll 
>< Mbol 
>< DpnII 

>< Dpnl 
>< BstYI 
>< BstI 
X BspAI 

>< Bspl43I Rsal >< 

X BscBI >< Rraal Csp6I X 

>< BamHI >< Alwl >< Mael Afal >< 

AATGGATCCA ATTTATGATG AGCCGACGAC GACTACTAGC GTGCCTTTGT AAGCACAAGA AAGTGAGTAC 
26050 26060 26070 26080 26090 26100 26110 

> < Tru9I 
>< Rsal 

> < Msel 
>< MboII 

> < Rsal >< Maell >< Rsal 
>< Csp6I >< Csp6I >< Tru9I >< Csp6I 

> < Afal >< Afal >< Msel >< Afal 
GAACTTATGT ACTCATTCGT TTCGGAAGAA ACAGGTACGT TAATAGTTAA TAGCGTACTT CTTTTTCTTG 

26120 26130 26140 26150 26160 26170 26180 

X TthHB8 I 
>< TaqI 

>< Rmal >< HinPlI > < Rsal 

> < Maelll >< Hin6I Fnu4HI >< 

>< Mael >< Rmal >< Hhal >< Csp6I 

>< Fokl >< Mael >< Cfol >< Bbvl > < Afal 

CTTTCGTGGT ATTCTTGCTA GTCACACTAG CCATCCTTAC TGCGCTTCGA TTGTGTGCGT ACTGCTGCAA 
26190 26200 26210 26220 26230 26240 26250 

>< Tru9I 

>< Tru9I >< Thai 

X Msel >< Mvnl 

>< Sspl >< Maell >< Msel 

>< Hpal >< BstUI Ksp632I > 

X Hindll >< Maell >< BspSOI x MboII Earl > 

X Hindi >< AccI >< AccII Eamll04I > 

TATTGTTAAC GTGAGTTTAG TAAAACCAAC GGTTTACGTC TACTCGCGTG TTAAAAATCT GAACTCTTCT 
26260 26270 26280 26290 26300 26310 26320 
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X Sau3AI 
X Ndell 
>< Mbol 
>< DpnII 
>< MboIIX Dpal 

>< XmnI >< BspAI> < Eco57I >< Tru9I 

>< Asp700IX Bspl43I >< Msel 

GAAGGAGTTC CTGATCTTCT GGTCTAAACG AACTAACTAT TATTATTATT CTGTTTGGAA CTTTAACATT 
26330 26340 26350 26360 26370 26380 26390 



>< Rsal 

>< Mnll >< Tru9I 

>< Csp6I >< Msel 

> < Nlalll >< Afal > < Alul 

GCTTATCATG GCAGACAACG GT ACT ATT AC CGTTGAGGAG CTTAAACAAC 
26400 26410 26420 26430 26440 



>< ScrFI 

>< Mval 
>< EcoRII 

>< Ecll36l 
>< DsaV NlalV >< 

>< BstOI 

>< BstNI Rmal >< 
>< BsiLI Mael >< 
X ApylBscBI >< 
TCCTGGAACA ATGGAACCTA 
26450 26460 



>< ScrFI 
>< Rmal 

>< Mval 
>< Mael 

>< EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI 

>< BstNI 

>< BsiLI 

>< Apyl >< Maelll 

GTAATAGGTT TCCTATTCCT AGCCTGGATT ATGTTACTAC AATTTGCCTA TTCTAATCGG AACAGGTTTT 
26470 26480 26490 26500 26510 26520 26530 



>< Pall 
>< Msel 
>< Mnll >< Maelll 
>< Haelll 
>< Eael 
>< BsuRI 
>< BsrI 

>< Rsal >< BspWI 

>< Csp6I >< Hindlll • >< BshI 

>< Afal X Alul >< Ball X Bbvl Fnu4HI X 

TGTACATAAT AAAGCTTGTT TTCCTCTGGC TCTTGTGGCC AGTAACACTT GCTTGTTTTG TGCTTGCTGC 
26540 26550 26560 26570 26580 26590 26600 



X Vspl 
X Tru9I 

x Msel >< HphI 

>< Sfcl X Asnl >< BsrI 

X AccI >< Aseix Maellix Acil 
TGTCTACAGA ATTAATTGGG TGACTGGCGG GATTGCGATT GCAATGGCTT GTATTGTAGG CTTGATGTGG 
26610 26620 26630 26640 26650 26660 26670 



X Espl 

X Ecc-571 
>< Ddel 

>< Celll >< Rsal 

x Bpull02I >< Csp6I 
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>< Bfrl >< Afal 

X Alul >< Acil MboII > 

CTTAGCTACT TCGTTGCTTC CTTCAGGCTG TTTGCTCGTA CCCGCTCAAT GTGGTCATTC AACCCAGAAA 

26680 26690 26700 26710 26720 26730 26740 



>< ScrFI 

X Neil 
>< Mspl 
X Hpall 
X HapII 
X DsaVX Mnll 

X BslI 

X BsiVI 

X BsaJI X Muni > < Xcml 

X Bcnl X Maelll x Acil X Nlalll 

CAAACATTCT TCTCAATGTG CCTCTCCGGG GGACAATTGT GACCAGACCG CTCATGGAAA GTGAACTTGT 



26750 



26760 



26770 



26780 



26790 



26800 



26810 



X Sau3AI 
X Ndell 
X Mbol 

>< Fbal 
X Dpnl I 

x Dpnl 
X BspAI 

X Bspl43I 
x BsiQI 
X Bell 



X Maelll 



>< Pall 
x Mspl 
x Hpall 
>< HapII 
>< Haelll 
X Gdill 
x Eael 
x BsuRI 
x BshI 



Tru9I >< 
Sinl 
Sau96I 
PpuMI 
NspIV 
Msel >< 
x Maelll 

> < Rmal >< Haell 

> < Mae I EcoOL0 9I 

X HinPlIEco47I 
X Styix Hin6I Drall 
X EcoT14I Cfrl3I 
X Ecol30IX Bspl43II 
X BssTlI BsiZI 
x BsaJI Bmel8I 
X Blnl X Hhal Avail 
X Avrll >< Cfol Asul 



CATTGGTGCT GTGATCATTC GTGGTCACTT GCGAATGGCC GGACACTCCC TAGGGCGCTG TGACATTAAG 
26820 26830 26840 26850 26860 26870 26880 



X Sau3AI 
X Ndell 
X Mbol 
X DpnII 
X Dpnl 
>< PssI >< BspMI 
X PspSII >< BspAI >< Xmnl 

X NspHU >< Bspl43I >< Asp700I > < Hgal Fnu4HI >< 

GACCTGCCAA AAG AG AT C AC TGTGGCTACA TCACGAACGC TTTCTTATTA CAAATTAGGA GCGTCGCAGC 
26890 26900 26910 26920 26930 26940 26950 



x Tfil 
>< Hinfl 

x Bbvl > < Tru9I 

X Bbvl >< Fnu4HI X Acil > < Msel 

GTGTAGGCAC TGATTCAGGT TTTGCTGCAT ACAACCGCTA CCGTATTGGA AACTATAAAT TAAATACAGA 



26960 



26970 



26980 



26990 



27000 



27010 



27020 



X Mspl 
X Hpall 
X HapII 
>< CfrlOI 
>< Bcgl/a 



x Sspl 



x Rsal 
>< Rmal 

x Csp6I 
>< Maeix Bcgl 

x Afal >< Maelll 



Hindu X 
Hindi >< 
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CCACGCCGGT AGCAACGACA ATATTGCTTT GCTAGTACAG TAAGTGACAA CAGATGTTTC ATCTTGTTGA 
27030 27040 27050 27060 27070 27080 27090 

>< ScrFI 

>< Mval 

>< Maeiri 
>< EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI 

>< BstNI 

X BsiLI TfiI 

><: A Py r >< Mnll Hinfl x 

CTTCCAGGTT ACAATAGCAG AGATATTGAT TATCATTATG AGGACTTTCA GGATTGCTAT TTGGAATCTT 
27100 27110 27120 27130 27140 27150 27160 

>< BsmAI >< Tru9I > < Mnll 

>< Maell >< Alw26I >< Msel >< Ddel >< MboIT 

GACGTTATAA TAAGTTCAAT AGTGAGACAA TTATTTAAGC CTCTAACTAA GAAGAATTAT TCGGAGTTAG 
27170 27180 27190 27200 27210 27220 27230 

>< Ksp632I 
>< MboII >< Earl 

>< MboII >< NlairiEamll04I X 

ATGATGAAGA ACCTATGGAG TTAGATTATC CATAAAACGA ACATGAAAAT TATTCTCTTC CTGACATTGA 
27240 27250 27260 27270 27280 27290 27300 

> < Rsal x Rsal 
>< Csp61 x Csp61 
> < Alul x Mnll > < Afal x Afal 

TTGTATTTAC ATCTTGCGAG CTATATCACT ATCAGGAGTG TGTTAGAGGT ACGACTGTAC TACTAAAAGA 
27310 27320 27330 27340 27350 27360 27370 

>< Mnll X HphI X HphI >< Mnll 

ACCTTGCCCA TCAGGAACAT ACGAGGGCAA TTCACCATTT CACCCTCTTG CTGACAATAA ATTTGCACTA 
27380 27390 27400 27410 27420 27430 27440 



X TthHB8 I 
X TaqI 
X Rsal 
>< Csp6I 

>< Rmal >< Bbvl 

>< Mael >< Afal , . 

ACTTGCACTA GCACACACTT TGCTTTTGCT TGTGCTGACG GTACTCGACA TACCTATCAG CTGCGTGCAA 
27450 27460 27470 27480 27490 27500 27510 



Sau3AI > 

< Pvull 

< PspSI 

< NspBII 
Ndell > 

Mbol > 
X Fnu4HI 
DpnII > 
BspAI > 

< Alul 



X HphI 
X Dpnl 



X Mnll 

FIGURE 13. 6 3 



>< SstI 
>< Sdul 
>< Sad 
>< NspII 
x HgiAI 
>< Eco2 4I 
< Ecll36II 

>< BspWI 
>< Bspl2B6I 
X Bmyl 
X Banll 
X Alw21I 



WO 2005/056584 



77/ 116 



PCT/FR2004/003106 



>< Bspl4 3I >< Mnll > < Alul Bbvl >< 

GATCAGTTTC ACCAAAACTT TTCATCAGAC AAGAGGAGGT TCAACAAGAG CTCTACTCGC CACTTTTTCT 
27520 27530 27540 27550 27560 27570 27580 

SstI >< 
Sdul >< 
SacI >< 
NspII >< 
HgiAI >< 
Eco24I >< 
EC1136II X 
Bspl286I >< 
Bmyl X 

x Rmal x Tru9I Banll x 

X Mael X Msel X Tru9I Alw21I x 

>< Fnu4HI X HphI x Msel Alul X 

CATTGTTGCT GCTCTAGTAT TTTTAATACT TTGCTTCACC ATTAAGAGAA AGACAGAATG AATGAGCTCA 
27590 27600 27610 27620 27630 27640 27650 



X Tru9I x Tru9I 

x Msel X Msel 

CTTTAATTGA CTTCTATTTG TGCTTTTTAG CCTTTCTGCT ATTCCTTGTT TTAATAATGC TT AT TAT ATT 



27660 



27670 



27680 



27690 



27700 



27710 



27720 



X XhoII 
x xbal 

> < ScrFI 

x Sau3AI 

x Rmal 
x Ndell 

> < Mval 

X Mfll 
X Mbol 
X EcoRUX Mael 

> < Ecll36I 

X DpnII 

x Dpnl 
x BstYI 

> < BstOI 

> < BstNI 

X TthHB8 I X BspAI > < Rsal 

>< DsaVx Bspl4 3I >< Mbol I 

> < BsiLI >< Csp6I 

>< TaqI > < Apyl > < Alwl > < Afal >< NlallE 

TTGGTTTTCA CTCGAAATCC AGGATCTAGA AGAACCTTGT ACCAAAGTCT AAACGAACAT GAAACTTCTC 
27730 27740 27750 27760 27770 27780 27790 

X HinPlI 
X Hir\6I 
>< Hhal 
>< Rsal >< Haell 
>< Sfcl >< Eco47iri 

>< Csp6I>< Cfol SfaNI X 
>< Ndel >< Afal X Bspl43II 

ATTGTTTTGA CTTGTATTTC TCTATGCAGT TGCATATGCA CTGTAGTACA GCGCTGTGCA TCTAATAAAC 
27800 27810 27820 27830 27840 27850 27860 



>< XhoII 
>< Sau3AI 
X Ndel I 
> < Mnll 

>< Mfll 
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>< Mbol 
>< DpnII 

>< Dpnl >< Rsal 

>< BstYI >< MboII 
>< NlalllX BspAI >< Csp6I >< Rmal 

>< Alwl >< Bspl43I >< Afal >< Mael 
CTCATGTGCT TGAAGATCCT TGTAAGGTAC AACACTAGGG GTAATACTTA TAGCACTGCT TGGCTTTGTG 
27870 27880 27890 27900 27910 27920 27930 



>< Sdul 

>< Rmal 
>< Nspl I 

>< Mael 
>< HgiAI 

>< Bspl28€I >< Nspl 

>< Bmyl >< NspHI 

>< Alw21I >< Nlalll >< Maelll 

CTCTAGGAAA GGTTTTACCT TTTCATAGAT GGCACACTAT GGT TCAAAC A TGCACACCTA ATGTTACTAT 
27940 27950 27960 27970 27980 27990 28000 



> < XhoII 

> < Sau3AI > < Van91I 

x PvuII 
>< Psp5I 

> < Ndell > < PflMI 

> < MfllX NspBII 

> < DpnII X HinPlI 

X Bspl43I >< Hin6I 

> < BstYI > < BslI X Hhal 

> < BspAI > < BsiYlX Cfol 

> < MboIX AlulX BspWI X 
>< Alwl X Dpnl > < AccB7I 



X Rmal 
X Mael 

BspWI 

>< Alul 



X Rsal 

>< NlalV 

X Kpnl x Nlalll 
x Eco64I >< Maelll 

x Csp6I>< HphI 

>< BscBI X Eco0651 

x BanI >< BspHI 
x Asp718 X Eco91I 

X Afal X BstPI 

X AccBlI X BstEII 

>< Acc65I >< Bbvl 



CAACTGTCAA GATCCAGCTG GTGGTGCGCT TATAGCTAGG TGTTGGTACC T T CAT G AAGG TCACCAAACT 



28010 



28020 



28030 



28040 



28050 



28060 



28070 



X 



Fnu4HI 
X Esp3l 
X BsmAI 
>< Alw26I 



X Rsal 
X Mae I I 
>< Csp6I 
X BsmBI 
>< Afal 



X Tru9I 
X Msel 
>< Dral 



>< Tru9I 
>< Msel 



X SinI 
>< Sau96I 
x NspIV 
NspHII X 

NlalV X 

X Eco47I 
X Cfrl3I 
X BsiZI 

BscBI X 

X Bmel8I 
X Avail 
x Asul 



GCTGCATTTA GAGACGTACT TGTTGTTTTA AATAAACGAA CAAATTAAAA TGTCTGATAA TGGACCCCAA 
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TCAAACCAAC GTAGTGCCCC CCGCATTACA TTTGGTGGAC CCACAGATTC AACTGACAAT AACCAGAATG 
28150 28160 28170 28180 28190 28200 28210 

>< HinPlI >< Styl 
>< Haell 

> < Pall >< Hin6l >< EcoT14I 

> < Haelll >< Hhalx Ecol30I 

>< BspWI >< BssTlI 

> < BsuRI >< Bspl43II 

>< Hgal> < BshI >< Cfolx BsaJI >< Hgal 

GAGGACGCAA TGGGGCAAGG CCAAAACAGC GCCGACCCCA AGGTTTACCC AATAATACTG CGTCTTGGTT 
28220 28230 28240 28250 28260 28270 28280 

>< TthHB8I 

> < ScrFI 
>< Pall 

>< PaeR7I 
>< NspIII 

> < Mval 
>< Haelll 
X EcoRII 

X Eco88I 

X Xhol > < EC1136I 
>< DsaV 
>< BsuRI 
>< Slal > < BstOI 
X MnllX Taql> < BstNI 
>< Ccrl > < BsiLI 
X Hinfl X BshI 

x Tfilx Bcoix BsaJI 
x Mnll x Ddel >< Aval > < Apyl 

X Alul X Ddel > < Nlalll X Bfrl >< Ama87I >< Mnll 
CACAGCTCTC ACTCAGCATG GCAAGGAGGA ACT T AG AT T C CCTCGAGGCC AGGGCGTTCC AATCAACACC 
28290 28300 28310 28320 28330 28340 28350 

>< SinI 
X Sau96I 
>< NspIV 

X NspHII 
X Eco47I 
X Cfrl3I 
X BsiZI 

>< Bmel8I > < Ksp632I 

X Avail > < Eamll04I 

X Asul > < Earl > < Aluix Mboll >< Maelll 

AATAGTGGTC CAGATGACCA AATTGGCTAC TACCGAAGAG CTACCCGACG AGTTCGTGGT GGTGACGGCA 
28360 28370 28380 28390 28400 28410 28420 



X SstI 
X Sdul 
X SacI 
x NspII 
>< HgiAI 
x Espl 

x Sau96I 
>< Styl >< Pall 

X Rraal X NspIV 
x Mael >< Haelll 
>< EcoTl4I >< Cfrl3I 
X Ecol30I X BsuRI 
X BssTlI > < BsrI 
>< BsaJI x BsiZI 



X Eco24I 
X Ecll36II 
X Ddel 
X Cell I 

X Bspl286I 
X Bpull02I 

>< Bmyl 

>< Banll >< Rsal 
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X Alw21I >< Csp6I >< Blnl >< Bshlx Hindlll 

>< HphI >< Alul >< Afal >< Avrll >< Asul >< Alul 

AAATGAAAGA GCTCAGCCCC AGATGGTACT TCTATTACCT AGGAACTGGC CCAGAAGCTT CACTTCCCTA 
28430 28440 28450 28460 28470 28480 28490 

>< HinPlI 
>< Hin6l 
>< Hhal 
X Haell 

X Cfol > < Mnll >< NlalV 

>< Bspl43II >< SfaNI >< Ddel >< BscBI 

CGGCGCTAAC AAAGAAGGCA TCGTATGGGT TGCAACTGAG GGAGCCTTGA ATACACCCAA AGACCACATT 
28500 28510 28520 28530 28540 28550 28560 

>< NlalV 
>< Eco64I 

>< BscBI 
>< BanI 

X Acil 

>< AccBlI >< Bbvl >< Fnu4HI >< Mnll 

GGCACCCGCA ATCCTAATAA CAATGCTGCC ACCGTGCTAC AACTTCCTCA AGGAACAACA TTGCCAAAAG 
28570 28580 28590 28600 28610 28620 28630 

>< Thai 
x Mnll 
>< Maell >< Mvnl 
>< Mnll BstUI X 

X Fnu4HI >< Ksp632I Bsp50I >< 

X BspWI >< Earl X BsaAIX Acil 

X Mnll X Mnll >< Acilx MboII X Eamll04I AccII >< 

GCTTCTACGC AGAGGGAAGC AGAGGCG GC A GTCAAGCCTC TTCTCGCTCC TCATCACGTA GTCGCGGTAA 
28640 28650 28660 28670 28680 28690 28700 

>< ScrFI 
x Mval 

X EcoRII X TthHB8I 

X Ecll36I >< Rmal 

X DsaVX Fnu4HI X Nhel 

X BstOI X Mnll 

X BstNI >< Mael 

X BsiLI > < BspWI 

>< Apyl x Bbvl >< TaqI >< Acil 

TTCAAGAAAT TCAACTCCTG GCAGCAGTAG GGGAAATTCT CCTGCTCGAA TGGCTAGCGG AGGTGGTGAA 

28710 28720 28730 28740 28750 28760 28770 

> < Thai 

> < Mvnl 

>< HphI >< Mnll 

> < HinPlI 

> < Hin6I 

X Hhal 

> < BstUI >< Rmal Pall x 

> < Bsp50I >< Mael Haelll >< 
X Bbvl >< CfoIX Fnu4HI BsuRI >< 

> < AccIlX BspWI X Alul BshI X 
ACTGCCCTCG CGCTATTGCT GCTAGACAGA TTGAACCAGC TTGAGAGCAA AGTTTCTGGT AAAGGCCAAC 

28780 28790 28800 28810 28820 28830 28840 

Rsal >< 

> < Pallx Maelll >< Mnll 

> < Haelll >< Fnu4HI Maell X 

> < BsuRI >< Ddel X Ddel Csp6I X 
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8tyH6 

> < BshI > < Bbvl >< Mnll >< BspWI >< SfaNI Afal >< 

AACAACAAGG CCAAACTGTC ACTAAGAAAT CTGCTGCTGA GGCATCTAAA AAGCCTCGCC AAAAACGT AC 



28850 
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28890 



28900 



28910 



>< Rsal 

>< Maelll 
>< Maell >< Esp3I 

>< Csp6I >< BsmAI 

>< Afal >< Alw26I> < 

TGCCACAAAA CAGTACAACG TCACTCAAGC ATTTGGGAGA CGTGGTCCAG AACAAACCCA AGGAAAT T TC 
28920 28930 28940 28950 . 28960 28970 28980 



>< Tthllll 
>< SinI 
>< Sau96I 
>< NspIV 
>< NspHII 
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>< Eco47I 
X Cfrl3I 
>< BsmBI 
>< BsiZI 
>< Bmel8I 
>< Avail 
>< Asul 
Asp I 



>< Styl 
X EcoT14I 
>< Ecol30I 
>< BssTlI 
>< BsaJI 



X SinI 
>< Sau96I 
>< NspIV 

>< NspHII 
^ >< NlalV 
X Eco47I 
X Cfrl3I 
X BsiZI 

>< BscBI 
>< Bmel8I 
>< Avail 
>< Asul 



>< Pall 
>< Kaelll 
>< Gdill 

>< Fnu4HI 
>< Eael 
>< BsuRI 
>< BshI 
>< Acil 



>< 



BspWI 
BspWI 



GGGGACCAAG ACCTAATCAG ACAAGGAACT GATTACAAAC ATTGGCCGCA AATTGCACAA TTTGCTCCAA 
28990 29000 29010 29020 29030 29040 29050 



>< Bsral >< tUalll 

>< BscCI >< Mnll >< Maelll >< Maelll >< Nlalll 

GTGCCTCTGC ATTCTTTGGA ATGTCACGCA TTGGCATGGA AGTCACACCT TCGGGAACAT GGCTGACTTA 



29060 



29070 



29080 



29090 



29100 



29110 



29120 



X XhoII 
X Sau3AI 
>< Ndell 
X Mfll 
X Mbol 

>< Eokl 
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> < Dpnl 
X BstYI 
X BspAI 

X BscBI X BstXlX Alwl> < Bspl43I 
TCATGGAGCC ATTAAATTGG ATGACAAAGA TCCACAATTC AAAGACAACG TCATACTGCT GAACAAGCAC 
29130 29140 29150 29160 29170 29180 29190 
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X Tthllll 
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>< Aspl 



BspWI x 



Espl >< 
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X Hgal Alul x 

ATTGACGCAT ACAAAACATT CCCACCAACA GAGCCTAAAA AGGACAAAAA GAAAAAGACT GATGAAGCTC 
29200 29210 29220 29230 29240 29250 29260 
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>< Plel 

>< Fnu4HI >< MboII 

>< BspWI >< MboII >< Ksp632I >< Gsul 

>< BsmAI >< Maelll >< Earlx Fnu4HI 

>< Alw26I >< Hinfl >< Eamll04I>< Bpml 

>< Acil >< Fnu4HI >< Bbvl >< Acil >< Nlalll 

AGCCTTTGCC GCAGAGACAA AAGAAGCAGC CCACTGTGAC TCTTCTTCCT GCGGCTGACA TGGATGATTT 
29270 29280 29290 29300 29310 29320 29330 



>< Nlalll >< Hinfl Nlalll >< 

>< Fokl >< Alul >< TfilX Ddel >< BspHI 

CTCCAGACAA CTTCAAAATT CCATGAGTGG AGCTTCTGCT GATTCAACTC AGGCATAAAC ACTCATGATG 
29340 29350 29360 29370 29380 29390 29400 



>< Maell >< AccI 

ACCACACAAG GCAGATGGGC TATGTAAACG TTTTCGCAAT TCCGTTTACG ATACATAGTC TACTCTTGTG 
29410 29420 29430 29440 29450 29460 29470 

>< Tru9I 
>< Tru9I 

X Msel 
>< Msel 

>< XmnI >< Hpal 

>< EcoRlX Maelll >< Hindll Tru9I >< 

>< Asp700I >< Bsgl >< Hindi Msel >< 

CAGAATGAAT TCTCGTAACT AAACAGCACA AGTAGGTTTA GTTAACTTTA ATCTCACATA GCAATCTTTA 
29480 29490 29500 29510 29520 29530 29540 



Xorll > 
TthHB8 I > 
TaqI >. 
Sau3AI >< 
Rsal >< 
>< ThalPvuI > 
Ndell >< 
>< Mnll 
>< MvnIMcrl > 
Mbol >< 
DpnII >< 
Dpnl >< 
Csp6I >< 
>< BstUI 
>< Haelll BspCI > 
BspAI >< 
>< TthHB8 I >< BspSOI 

>< Pall Bspl43I >< 
>< BsuRI BsiEI > 
>< BshlAfal >< 

>< Mnll >< TaqI >< Acil 

>< Maelll >< Mnll >< AccII 

ATCAATGTGT AACATTAGGG AGGACTTGAA AGAGCCACCA CATTTTCATC GAGGCCACGC GGAGTACGAT 
29550 29560 29570 29580 29590 29600 29610 



>< Sdul 
>< Nspir 

>< MboII >< Vspl 

>< Ksp632I >< Eco24I >< Tru9I 

>< Rsal >< Rmal >< Fnu4HI >< Bspl286I >< Msel 

>< Csp6I >< Mael >< Earl >< Bmyl >< Asnl 

>< Afal >< Bbvl > < AlulX Eamll04I X Banll X Asel 
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CGAGGGT AC a gtgaataatg ctagggagag ctgcctatat ggaagagccc taatgtgtaa aattaatttt 

29620 29630 29640 29650 29660 29670 29680 

>< Tru9I >< Ddel 
>< Msel >< Bfrl 
>< Nlalll > < Alul 
AGTAGTGCTA TCCCCATGTG ATTTTAATAG CTTCTTAGGA GAATGACAAA AAAAAAAAAA AAAAAA 
29690 29700 29710 29720 29730 29740 
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1-3059 
S-040530 



1 CTCTTCTGGAAAAAGGTAGGCTTATCATTAGAGAAAACAACAGAGTTGTGGTTTCAAGTG 



1-3059 61 AT ATT CTTGTT AACAACTAAACGAACATGTTTATTTTCTT ATTATTTCTTACTCTCACT A 

S-04 0530 1 GG ii T tr C ti C iiitMiit*H C M »c" » "C'GC'G" "c 1,,, G""C" "G" "C" 

1-3059 121 GTGGTAGTG ACCTTGACCGGTGCACCACTTTTG ATGATGTTCAAGCTCCT AATTACACTC 

S— 04 0530 4 4 "C" "C" "C " " M " "G" " " " " 11 " " 11 " " " " M C M "C" "C" "C" "G " "G" "C" "C" "C" " " " "C" 



1-3059 
S-040530 



181 
104 



AACATACTT_CATCTATGAGGGGGGTTTACTATCCTGATGAAATTTTTAGATCAGACACT 
iiQ»i "CAG" "G" " M " C" " " "C" "G" " 11 " "C" "C" M C" "G" "C" 11 "C f, GAGC" " " " "C 



1-3059 24 0 CTTTATTTAACTCAGGATTTATTTCTTCCATTTTATTCTAATGTTACAGGGTTTCATACT 

S-04 0530 163 »»G n "CC' f G , ' ,, C" ,M, ""CC"G ,,,, C" "G" ,, C M "C""CAGC""C""G""C" »c n "C ,T "C""C 



1-3059 
S-040530 



300 
223 



ATTAATCATACGTTTGGCAACCCTGTCATACCTTTTAAGGATGGTATTTATTTTGCTGCC 
i» hq« hqm hqm ,, c M "C" " " " M " " "C" "G" "C" "C" "C" 11 11 " "C" "C" "C" "C" "C" "C" " " 



1-3059 360 ACAGAGAAATCAAATGTTGTCCGTGGTTGGGTTTTTGGTTCTACCATGAACAACAAGTCA 

S— 0 4 0530 283 " "C" n " " "GAGC" "C" "G" "G" "G ,f "C" " " " "G" "C" "CAGC" " " 11 M " " ,f " " " " 11 n " AGC 



1-3059 
S-040530 



420 
343 



CAGTCGGTGATTATTATTAACAATTCTACTAATGTTGTTATACGAGCATGTAACTTTGAA 
ii u it ^qq 1 * " « m iiqu «q«* " C" " " " "CAGC" M C" " C" "G" " G" " C" "G 11 " C n " C" " " 11 "C M M G 



1-3059 
S-040530 



480 
403 



TTGTGTGACAACCCTTTCTTTGCTGTTTCTAAACCCATGGGTACACAGACACATACTATG 

Q II II II II Q » " I' II II " II «» Q « » •• II » Q II II Q I' II Qll ll£ II II II II II II » II II II II Q " II Q II II II II II Q II II Q II II Q II It II 



1-3059 540 ATATTCGATAATGCATTTAATTGCACTTTCGAGTACATATCTGATGCCTTTTCGCTTGAT 

S— 0 40530 4 63 " "C" " 11 M "C" "C" "C" "C" "C" " 11 M "C M " " 11 " 11 n " " " " CAGC " "C M " " " "CAGC" "G" "C 

1-3059 600 GTTTCAGAAAAGTCAGGTAATTTTAAACACTTACGAGAGTTTGTGTTTAAAAATAAAGAT 

S-040530 523 " "GAGC" "G" " "AGC" "C" ,r C" "C" "G" " "C"G" "G" " " " "C" " " " "C" "G" "C" "G" "C 



1-3059 
S-040530 



660 
583 



GGGTTTCTCTATGTTTATAAGGGCTATCAACCTATAGATGTAGTTCGTGATCTACCTTCT 
it «q« "q» "(5" "C M ,, G" M C M " " " " n " ,f C ,f "G M "C" "C" "C " "G" "GA"A" "C" "G" "CAGC 



1-3059 
S-040530 



720 
643 



GGTTTTAACACTTTGAAACCTATTTTTAAGTTGCCTCTTGGTATTAACATTACAAATTTT 

II II Q II II Q II M II II II QQ II II II II Q II HQ II II £ I» II Q If II It Q II tl If II £11 MQ II I » £11 HQ II II II H II £ II II Q If II Q II II £ 



1-3059 780 AGAGCCATTCTT ACAGCCTTTTCACCTGCT CAAG AC ATT TGGGGCACGT CAGC TG CAGC C 

S — 04 0530 703 C"G" M " " "C""G" "C" H " " " "AGC" 11 " " "C" "G" " " " "C" " ,l " " " " "CAGC" "C" "C" " " 

1-3059 840 TATTTTGTTGGCTATTTAAAGCCAACTACATTTATGCTCAAGTATGATGAAAATGGT ACA 

S— 04 0530 7 63 11 "C" "C" 11 G" " " " "CC"G" " " " "T" " C" " C" fl C" " " " "G" " " " 11 C " "C " "G" " C" "C" 11 C 

1-3059 900 ATCACAG ATGCTGTTG ATTGTTCTC AAAATCC ACTTGCTGAACTC AAATG CTCTGTT AAG 

S-040530 823 """ ""C" "C""C" "G""C" "CAGC" "G" "C""C" "G" "C" "G" "G" "G" " "AGC" "G"" " 



1-3059 
S-040530 



960 
883 



AGCTTTGAGATTGACAAAGGAATTTACCAGACCTCTAATTTCAGGGTTGTTCCCTCAGGA 
ii it H it »iQ ii ii « ii »q*» ii » i» iiq ti "qh hq ii ii ii ii ii ii ii ii "^qc" "C" " " " " A* 1 "G" "G " "TAGC" "C 



1-3059 
S-040530 



1020 
943 



GATGTTGTGAGATTCCCTAATATTACAAACTTGTGTCCTTTTGGAGAGGTTTTTAATGCT 

II II II It II QM tl »»C"QH » H II HQ It II tl II HQ H "Q" H It Q II II II ItQH IIQII HQII II Q II "J^** HQ" IIQII ItQII 11 Q 



1-3059 
S-040530 



1080 
1003 



ACTAAATTCCCTTCTGTCTATGCATGGGAGAGAAAAAAAATTTCTAATTGTGTTGCTGAT 
ii it qm «q" n u it tt Qjc^QC" "Q" "C" 11 C" " 11 M " "C"G" "G" 11 G" "CAGC 11 "C" "C" 11 G" "C" 11 C 



1-3059 
S-040530 



1140 
1063 



TACTCTGTGCTCTACAACTCAACATTTTTTTCAACCTTTAAGTGCTATGGCGTTTCTGCC 
it ft h^qq it 11 »* 11 n G" " " " " " " "C" "C 1 ' "C" "CAGC" " " " "C" " " " " " " "C" " " " "GAGC" " " 



1-3059 1200 ACT AAGTTGAATG ATCTTTGCTTCTCCAATGTCTATGCAG ATTCTTTTGT AGTCAAGGGA 

S — 0 4 0 5 3 0 1123 " "C " " 11 C 11 " 11 " C M " C " "G " " " 11 " "AG " " " C " " G " " C " " C " " CAGC 11 " C " " G " " G " " " " " C 



1-3059 1260 GATGATGTAAGACAAATAGCGCCAGGACAAACTGGTGTTATTGCTGATTATAATTATAAA 

S-040530 1183 " " C * 1 " C " " G " " " " " G " " C " n C " " T " " C " " G M " C " " C " " G " " C " " C " " C " " C " " C " " C " " G 
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1-3059 1320 TTGCCAGATGATTTCATGGGTTGTGTCCTTGCTTGGAATACTAGGAACATTGATGCTACT 

S-040530 124 3 C" " M "C""C" "C"" nnn iic""c""G'* M G""C" "•«"«£" "CC"""" "" "C" "C w "C" "A 

1-3059 1380 TC AACTG GT AAT T AT AAT T AT AAAT AT AGGT AT CTT AGAC AT GGC AAGCTT AGGCCCTTT 

S-040530 1303 A GC ,,M C""C M, X" ,, C" ,,,, " ,, C ,, "G" , XC ,, C" , X ,,U GC ,, G""C ,,,, """" ,,,, GC"" ,,,,,,,,,, C 

1-3059 144 0 GAGAGAGACATATCTAATGTGCCTTTCTCCCCTGATGGCAAACCTTGCACCCCACCTGCT 

S-040530 1363 """C"G"" ,,M "C" »c ,,M C ,Mf " ""C" " ,, AG" ,, "C n w C"" n " "G" "C f,n " n " "C" " " " "C 

1-3059 1500 CTT AATTGTT ATTGGCCATT AAATGATTATGGTTTTT AC AC C ACT ACT GGC ATTGGCTAC 

S-040530 1423 «»g" ,i C" "C" »c n " " " M CC"G" "C" "C" "C M "C" n C" " "«»'»c""C n """"C""" ""T 

1-3059 1560 CAACCTTACAGAGTTGTAGT ACTTTCTTTTGAACTTTT AAATGCACCGGCCACGGTTTGT 

S-04 0530 1483 » »»G"' f C" " " " M " " "G" "G" "G" "GAGC" "C" "G" n GC M G ,r, 'C" "C^'T" " " »"C""G""C - 

1-3059 1620 GG ACCAAAATT ATCCACTGACCTT ATT AAGAACCAGTGTGTCAATTTT AATTTT AATGG A 

S-040530 1543 " "C" "C" "GC'GAG" ""C"" «n«G""C" n " " " " 11 " "C" "G" n C" n C w n C M "C" "C ?,,, C 

1-3059 1680 CTCACTGGT ACTGGTGTGTTAACTCCTTCTTCA_AAGAGATTTCAACCATTTCAACAAT 

S-040530 1603 w»G""C nM C ,,,, C ,,M C"' , "C M G n "C"" "AG" "GC" " "C"C" M C""G" "C""C" M G" "G" 

1-3059 1738 TTGGCCGTGATGTCTCTG ATTTCACTGATT CCGTTCGAG ATCCTAAAAC ATCTGAAATAT 

S-040530 1661 "C" " " " "G" " " " ,, GAGC" ,, C M " n " "C" "CAG" M "G M "G" "C" "C" "G" "CAGC" "G" "CC 

1-3059 17 98 TAGACATTTCACCTTGCTCTTTTGGGGGTGTAAGTGTAATTACACCTGGAACAAATGCTT 

S-040530 1721 "G" "" " "CAGC""C" " "AGC" "C" "C" "C" "GTCC" "G' ,M C" "C ,f "C""C" "C" "C" "CA 

1-3059 1858 __C ATCTGAAGTTGCTGTTCTATATCAAGATGTT AACTGC ACTG ATGTTTCT ACAGCAATC 

S-040530 17 81 G""G" " " M " "G M "C" "G" "G" "C" "G""C" "G" " " " ""C" "C M,, GAGC" ,f C" "C"" " 

1-3059 1917 C AT G CAG AT C AACT C AC AC C AGCT TGGCG C AT AT AT T CT ACTGG AAAC AAT GT ATTC C AG 

S-040530 1840 *•"c ,,,, C M,, C ,, "G""G" M C""C" ,l C ,Tr,,M,1, G" l, C ,, "CAGC" ,, C ,,,, G ,, " ,,,,,, C ,,,, G"" ,, " ,, n 

X-3059 1977 ACTCAAGCAGGCTGTCTTATAGGAGCTGAGCATGTCGACACTTCTTATGAGTGCGACATT 

S-040530 1900 " "C " "G" "C" " " " "C" "G" "C" "C" "C" " " M M c " "G" " " " "CAGC " "C" " M " " " " " " " "C 

1-3059 2037 CCT ATTGGAGCTGGCATTTGTGCT AGTTACCATACAGTTTCTTT ATTACGTAGTACTAGC 

S-040530 1960 ,,n C n ""C" "C M "A" "C" T, C""C" "C" " " " "C" "C" "GAGCC ,, GC ,, G""G ,, »C""C"" " 

1-3059 20 97 CAAAAATCTATTGTGGCTTATACTATGTCTTTAGGTGCTGATAGTTCAATTGCTTACTCT 

S-04 0530 2020 »"G n «»G ,,,, C ,,tt C l,,r,,,, "C ,,,, C ,, "C , ' M "AGCC"G" ,, C ,, "C ,, "C" ,, CAGC ,,,, C" , *C ,,,, "AGC 

1-3059 2157 AAT AACACC ATTGCTATAC CT ACT AACT TTTCAATTAGC ATT ACT ACAGAAGT AATGCCT 

S-040530 2080 ""C" n " "" " " "C" "C" "C" M C""C M M " " "CAGC" "CTC" " "C" "C" "C" " " " n G n " t,,,u C 

1-3059 2217 GTTTCT ATGGCT AAAACCTCCGTAGATTGT AAT ATGTACATCTGCGGAGATTCT ACTGAA 

S-040530 2140 ,,M GAGC"""""C""G n "AAG ,,M,, G"" ««"C MM C nnnn »»»""•• »"»"c ""CAGC" "C""G 

1-3059 2277 TGTGCTAATTTGCTTCTCCAATATGGTAGCTTTTGCACACAACTAAATCGTGCACTCTCA 

S-040530 2200 «'"c M,, C M "CC"" M "G ,,,, G w,, G , ' ,, C""C""" ,,,, C"" ,,M, 'C" M G""G M,, C ,,,, G ,,,, C ,,,, GAGC 

1-3059 2337 GGTATTGCTGCTG AACAGGATCGCAAC ACACGTGAAGTGTTCGCTCAAGTCAAACAAATG 

S-04 0530 2260 " "C" "C" "C" "C" "G" " "C" "G" " " " "CA"A" " " " " " " M " " M C"" " " "G" "G" "G" " " 

1-3059 2397 T ACAAAACCCCAACTTTGAAAT ATTTTGGTGGTTTT AATTTTTCACAAAT ATT ACCTGAC 

S-04 0530 2320 ""T" "G n " """C" M cC f,,, ""G f, ' , C ,, "C""G ,, "C" "C" ,, C M, 'C" "x""G""CC"G" "C" 

1-3059 2457 CCTCTAAAGCCAACTAAGAGGTCTTTTATTGAGGACTTGCTCTTTAATAAGGTGACACTC 

S-04 0530 2380 " " " ""G" " " " "C" "C" ""C"C" U C" U C" "C" " nn " "C" " " M G" "C" "C" "A" " "C" "G 

1-3059 2517 GCTG AT GCT GGCT T CAT GAAGC AAT ATGG CG AAT G C CT AGGT GAT ATT AAT G CT AGAG AT 

S-040530 2440 " "C" , 'C" "C" " " " "T" " " " "" " W G ,,,, C" " , ' " "G MM " W "G""C" "c""C""C M "CC"G" "C 

1-3059 2577 CTCATTTGTGCGCAGAAGTTCAATGGGCTTACAGTGTTGCCACCTCTGCTCACTGATGAT 

S-040530 2500 " "g m,, C""C" "C""" w """T" "C" " """G" "C n ""C n " " "C" "C" " ,,,,r, G n "C""C""C 

1-3059 2 637 ATGATTGCTGCCTACACTGCTGCTCTAGTTAGTGGTACTGCCACTGCTGGATGGACATTT 

S-040530 2560 " " " M,, C" "C" " "T" "A" "C" "C" "G M "G" "C MM C" '^"""""C" "^'"C" " " " "C" "C 
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1-3059 2697 GGTGCTGGCGCTGCTCTTCAAAT ACCTTTTGCTATGC AAATGGC AT AT AGGTT CAATGGC 

S— 04 0530 2620 " "A" "C" "A" "C" "C n "G ,? "G" "C" "C" "C" f, C" " " " "G" " " " "C" "CC" " " " " " "C" " " 

1-3059 2757 ATTGGAGTT ACCCAAAATGTTCTCT ATGAGAACCAAAAACAAAT CGCC AACC AATTT AAC 

S-040530 2 680 " "C" "C" "G" " " " "G" "C" "G" "G" "C" " " " " " 11 "G" "G" "G" " n " " " " " "G" "C" " " 

1-3059 2817 AAGGCGATTAGTCA7UVTTCAAGAATCACTTACAACAACATCAACTGCATTGGGCAAGCTG 

S— 04 0530 27 4 0 " " " " "C" "C" "C" "G" "C" "G" "GAGC" "G" "C" " " " "CAGC" "C" "CC" " " " " " " " " " " 

1-3059 2877 C AAGACGTTGTTAACCAGAATGCTCAAGCATT AAAC AC ACTTGTT AAACAACTTAGCTCT 

S - 0 4 0 5 3 0 2800 " " G " " " " " G " " G " " " " 11 " " " C " " C " " G " " CC " G " " " " " C " " G " " G " " G " " G " " G " " " AGC 

1-3059 2937 AATTTTGGTGCAATTTCAAGTGTGCTAAATGATATCCTTTCGCGACTTGATAAAGTCGAG 

S- 04 0530 2860 " "C" "C" "C""C""CAGCTC" " """"G" "C" "C" """ "GAGCA"G" "G" "C" " " " "G" " " 

1-3059 2997 GCGGAGGTACAAATTGACAGGCTAATTACAGGCAGACTTCAAAGCCTTCAAACCTATGTA 

S— 040530 2920 " "C" "A" "G" "G" "C" " "C M " " "G" "C" "C" "AC"C" 11 G" "GTC" " "G" "G" " " " "C" "G 

1-3059 3057 AC ACAACAACTAATCAGGGCTGCTGAAATC AGGGCTTCTGCT AATCTTGCTGCT ACT AAA 

S— 04 0530 2980 " "C" "G" "G" "G" " " " "A" "C" "C" "G" " "C" " " "CAGC" "C" " " " "G" "C" "C" "C" "G 

1-3059 3117 ATGTCTG AGTGTGTTCTTGGAC AATC AAAAAGAGTT GACTTTTGTGG AAAGGGCTACC AC 

S— 040530 3040 "" "AGC" " " " "C " "G" "G" "C M "GAGC 11 "G" " 11 " "G" " " " " C " "C" "C" " " " " " " "T " " " 

1-3059 3177 CTTATGTCCTTCCCACAAGCAGCCCCGCATGGTGTTGTCTTCCTACATGTCACGTATGTG 

S— 04 0530 3100 " "G" " "AG" " " " " "C" "G" "C" " " " "C" "C" "C" "G" "G" " " " "G" "C" "G" "C" "C" " " 

1-3059 3237 CCATCCCAGGAGAGGAACTTCACCACAGCGCCAGCAATTTGTCATGAAGGCAAAGCATAC 
S— 040530 . 3160 " "TAG" " " " " " M c rt " "" "" """" »•« "c"'^"" " " "C" "C" "C""C" "G" " " " "G" "C" " " 

1-3059 32 97 TTCCCTCGTGAAGGTGTTTTTGTGTTTAATGGCACTTCTTGGTTTATTACACAGAGGAAC 

S— 040530 3220 " " " " "C" "G" "G" "C" "G" "C" " " " " " " "C" " " " "CAGC" " " " "C" "C" "C" *' "C"C" " " 

1-3059 3357 TTCTTTTCTCCACAAATAATTACTACAGACAATACATTTGTCTCAGGAAATTGTGATGTC 

S— 040530 3280 " " " " "CAGC" "C" "G" "C" "C" "C" " " " " " " "C" "C" "C" "G" "C" "C" "C" " " " " " " "G 

1-3059 3417 GTTATTGGCATCATTAACAACACAGTTTATGATCCTCTGCAACCTGAGCTTGACTCATTC 

S— 040530 334 0 " "G" "C" " " " " " " "C" "T" " " ""c" "G" "C" "C" "C" " " " "G" "C" " " " "G" " "AGC" " " 

1-3059 3477 AAAG AAG AGCTGGACAAGTACTTCAAAAATCAT AC ATCACCAGATGTTGATCTTGGCG AC 

S— 040530 34 00 " "G" "G" " " " " " " " " " "A" " " " 11 " " "G" "C" "C" "C" "C" "C" "C" "G" "C" "G" " " " "T 

1-3059 3537 ATTTCAGGCATTAACGCTTCTGTCGTCAACATTCAAAAAGAAATTGACCGCCTCAATGAG 

S- 04 0530 34 60 " "CAGC" " " " "C" " " " "C" "C" "G" "G" " " " "C" "G" "G" "G" "C" " "A" A" "G" "C" "A 

1-3059 3597 GTCGCTAAAAATTTAAATGAATCACTCATTGACCTTCAAGAATTGGGAAAATATGAGCAA 

S-040530 3520 " "G" "C" "G""CC"G" "C" "GAGC" "G""C" " " ""G""G""GC""""C""G""C"""""G 

1-3059 3657 TATATTAAATGGCCTTGGTATGTTTGGCTCGGCTTCATTGCTGGACTAATTGCCATCGTC 

S-040530 3580 " "C" "C" "G" " " " "C" " " " "C" "G" " " " "G" " " " " " " "C" "C" "C" "G" "C" " " " " " " "G 

1-3059 3717 ATGGTTACAATCTTGCTTTGTTGCATGACTAGTTGTTGCAGTTGCCTCAAGGGTGCATGC 

S-04 0530 364 0 " " " " "G" "C" " "C" " " "G" "C" " " " " " " "C" "C" "C" "T" "C" " " " "G" "A" "C" "C" " " 

1-3059 3777 TCTTGTGGTTCTTGCTGCAAGTTTGATGAGGATGACTCTGAGCCAGTTCTCAAGGGTGTC 

S— 040530 3700 AGC" " " " "CAGC" " " " " " " " " " "C" "C" " " " "C" " "AGC" " " " "C" "G" "G" " " " "C" "G 

1-3059 3837 AAATT ACATTACACATAAACGAACTT ATGGATTTGTTT ATGAGATTTTTT ACT CTTGG AT 

S-040530 3760 " »GC"G""C"""""C"G"T " " " "CGA" 

1-3059 38 97 CAATTACTGCACAGCCAGTAAAAATTGACAATGCTTCTCCTGCAAGT 
S-040530 
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<170> Patentln version 3.1 

<210> 1 

<211> 29746 

<212> DNA 

<213> CORONAVIRUS 



<400> 1 
atattaggtt 


tttacctacc 


caggaaaagc 


caaccaacct 


cgatctcttg 


tagatctgtt 


60 


ctctaaacga 


actttaaaat 


ctgtgtagct 


gtcgctcggc 


tgcatgccta 


gtgcacctac 


120 


gcagtataaa 


caataataaa 


ttttactgtc 


gttgacaaga 


aacgagtaac 


tcgtccctct 


180 


tctgcagact 


gcttacggtt 


tcgtccgtgt 


tgcagtcgat 


catcagcata 


cctaggtttc 


240 


gtccgggtgt 


gaccgaaagg 


taagatggag 


agccttgttc 


ttggtgtcaa 


cgagaaaaca 


300 


cacgtccaac 


tcagtttgcc 


tgtccttcag 


gttagagacg 


tgctagtgcg 


tggcttcggg 


360 


gactctgtgg 


aagaggccct 


atcggaggca 


cgtgaacacc 


tcaaaaatgg 


cacttgtggt 


420 


ctagtagagc 


tggaaaaagg 


cgtactgccc 


cagcttgaac 


agccctatgt 


gttcattaaa 


480 


cgttctgatg 


ccttaagcac 


caatcacggc 


cacaaggtcg 


ttgagctggt 


tgcagaaatg 


540 


gacggcattc 


agtacggtcg 


tagcggtata 


acactgggag 


tactcgtgcc 


acatgtgggc 


600 


gaaaccccaa 


ttgcataccg 


caatgttctt 


cttcgtaaga 


acggtaataa 


gggagccggt 


660 


ggtcatagct 


atggcatcga 


tctaaagtct 


tatgacttag 


gtgacgagct 


tggcactgat 


720 


cccattgaag 


attatgaaca 


aaactggaac 


actaagcatg 


gcagtggtgc 


actccgtgaa 


780 


ctcactcgtg 


agctcaatgg 


aggtgcagtc 


actcgctatg 


tcgacaacaa 


tttctgtggc 


840 


ccagatgggt 


accctcttga 


ttgcatcaaa 


gattttctcg 


cacgcgcggg 


caagtcaatg 


900 


tgcactcttt 


ccgaacaact 


tgattacatc 


gagtcgaaga 


gaggtgtcta 


ctgctgccgt 


960 


gaccatgagc 


atgaaattgc 


ctggttcact 


gagcgctctg 


ataagagcta 


cgagcaccag 


1020 


acacccttcg 


aaattaagag 


tgccaagaaa 


tttgacactt 


tcaaagggga 


atgcccaaag 


1080 


tttgtgtttc 


ctcttaactc 


aaaagtcaaa 


gtcattcaac 


cacgtgttga 


aaagaaaaag 


1140 


actgagggtt 


tcatggggcg 


tatacgctct 


gtgtaccctg 


ttgcatctcc 


acaggagtgt 


1200 


aacaatatgc 


acttgtctac 


cttgatgaaa 


tgtaatcatt 


gcgatgaagt 


ttcatggcag 


1260 


acgtgcgact 


ttctgaaagc 


cacttgtgaa 


cattgtggca 


ctgaaaattt 


agttattgaa 


1320 


ggacctacta 


catgtgggta 


cctacctact 


aatgctgtag 


tgaaaatgcc 


atgtcctgcc 


1380 


tgtcaagacc 


cagagattgg 


acctgagcat 


agtgttgcag 


attatcacaa 


ccactcaaac 


1440 


attgaaactc 


gactccgcaa 


gggaggtagg 


actagatgtt 


ttggaggctg 


tgtgtttgcc 


1500 


tatgttggct 


gctataataa 


gcgtgcctac 


tgggttcctc 


gtgctagtgc 


tgatattggc 


1560 


tcaggccata 


ctggcattac 


tggtgacaat 


gtggagacct 
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atactgagtc gtgaacgtgt taacattaac attgttggcg attttcattt gaatgaagag 1680 

gttgccatca ttttggcatc tttctctgct tctacaagtg cctttattga cactataaag 1740 

agtcttgatt acaagtcttt caaaaccatt gttgagtcct gcggtaacta taaagttacc 1800 

aagggaaagc ccgtaaaagg tgcttggaac attggacaac agagatcagt tttaacacca 1860 

ctgtgtggtt ttccctcaca ggctgctggt gttatcagat caatttttgc gcgcacactt 1920 

gatgcagcaa accactcaat tcctgatttg caaagagcag ctgtcaccat acttgatggt 1980 

atttctgaac agtcattacg tcttgtcgac gccatggttt atacttcaga cctgctcacc 2040 

aacagtgtca ttattatggc atatgtaact ggtggtcttg tacaacagac ttctcagtgg 2100 

ttgtctaatc ttttgggcac tactgttgaa aaactcaggc ctatctttga atggattgag 2160 

gcgaaactta gtgcaggagt tgaatttctc aaggatgctt gggagattct caaatttctc 2220 

attacaggtg tttttgacat cgtcaagggt caaatacagg ttgcttcaga taacatcaag 2280 

gattgtgtaa aatgcttcat tgatgttgtt aacaaggcac tcgaaatgtg cattgatcaa 2340 

gtcactatcg ctggcgcaaa gttgcgatca ctcaacttag gtgaagtctt catcgctcaa 2400 

agcaagggac tttaccgtca gtgtatacgt ggcaaggagc agctgcaact actcatgcct 2460 

cttaaggcac caaaagaagt aacctttctt gaaggtgatt cacatgacac agtacttacc 2520 

tctgaggagg ttgttctcaa gaacggtgaa ctcgaagcac tcgagacgcc cgttgatagc 2580 

ttcacaaatg gagctatcgt tggcacacca gtctgtgtaa atggcctcat gctcttagag 2640 

attaaggaca aagaacaata ctgcgcattg tctcctggtt tactggctac aaacaatgtc 2700 

tttcgcttaa aagggggtgc accaattaaa ggtgtaacct ttggagaaga tactgtttgg 2760 

gaagttcaag gttacaagaa tgtgagaatc acatttgagc ttgatgaacg tgttgacaaa 2820 

gtgcttaatg aaaagtgctc tgtctacact gttgaatccg gtaccgaagt tactgagttt 2880 

gcatgtgttg tagcagaggc tgttgtgaag actttacaac cagtttctga tctccttacc 2940 

aacatgggta ttgatcttga tgagtggagt gtagctacat tctacttatt tgatgatgct 3000 

ggtgaagaaa acttttcatc acgtatgtat tgttcctttt accctccaga tgaggaagaa 3060 

gaggacgatg cagagtgtga ggaagaagaa attgatgaaa cctgtgaaca tgagtacggt 3120 

acagaggatg attatcaagg tctccctctg gaatttggtg cctcagctga aacagttcga 3180 

gttgaggaag aagaagagga agactggctg gatgatacta ctgagcaatc agagattgag 3240 

ccagaaccag aacctacacc tgaagaacca gttaatcagt ttactggtta tttaaaactt 3300 

actgacaatg ttgccattaa atgtgttgac atcgttaagg aggcacaaag tgctaatcct 3360 

atggtgattg taaatgctgc taacatacac ctgaaacatg gtggtggtgt agcaggtgca 3420 

ctcaacaagg caaccaatgg tgccatgcaa aaggagagtg atgattacat taagctaaat 3480 

ggccctctta cagtaggagg gtcttgtttg ctttctggac ataatcttgc taagaagtgt 3540 

ctgcatgttg ttggacctaa cctaaatgca ggtgaggaca tccagcttct taaggcagca 3600 

tatgaaaatt tcaattcaca ggacatctta cttgcaccat tgttgtcagc aggcatattt 3660 
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ggtgctaaac 


cacttcagtc 


tttacaagtg 


tgcgtgcaga 


cggttcgtac 


acaggtttat 


3720 


attgcagtca 


atgacaaagc 


tctttatgag 


caggttgtca 


tggattatct 


tgataacctg 


3780 


aagcctagag 


tggaagcacc 


taaacaagag 


gagccaccaa 


acacagaaga 


ttccaaaact 


3840 


gaggagaaat 


ctgtcgtaca 


gaagcctgtc 


gatgtgaagc 


caaaaattaa 


ggcctgcatt 


3900 


gatgaggtta 


ccacaacact 


ggaagaaact 


aagtttctta 


ccaataagtt 


actcttgttt 


3960 


gctgatatca 


atggtaagct 


ttaccatgat 


tctcagaaca 


tgcttagagg 


tgaagatatg 


4020 


tctttccttg 


agaaggatgc 


accttacatg 


gtaggtgatg 


ttatcactag 


tggtgatatc 


4080 


acttgtgttg 


taataccctc 


caaaaaggct 


ggtggcacta 


ctgagatgct 


ctcaagagct 


4140 


ttgaagaaag 


tgccagttga 


tgagtatata 


accacgtacc 


ctggacaagg 


atgtgctggt 


4200 


tatacacttg 


aggaagctaa 


gactgctctt 


aagaaatgca 


aatctgcatt 


ttatgtacta 


4260 


ccttcagaag 


cacctaatgc 


taaggaagag 


attctaggaa 


ctgtatcctg 


gaatttgaga 


4320 


gaaatgcttg 


ctcatgctga 


agagacaaga 


aaattaatgc 


ctatatgcat 


ggatgttaga 


4380 


gccataatgg 


caaccatcca 


acgtaagtat 


aaaggaatta 


aaattcaaga 


gggcatcgtt 


4440 


gactatggtg 


tccgattctt 


cttttatact 


agtaaagagc 


ctgtagcttc 


tattattacg 


4500 


aagctgaact 


ctctaaatga 


gccgcttgtc 


acaatgccaa 


ttggttatgt 


gacacatggt 


4560 


tttaatcttg 


aagaggctgc 


gcgctgtatg 


cgttctctta 


aagctcctgc 


cgtagtgtca 


4620 


gtatcatcac 


cagatgctgt 


tactacatat 


aatggatacc 


tcacttcgtc 


atcaaagaca 


4680 


tctgaggagc 


actttgtaga 


aacagtttct 


ttggctggct 


cttacagaga 


ttggtcctat 


4740 


tcaggacagc 


gtacagagtt 


aggtgttgaa 


tttcttaagc 


gtggtgacaa 


aattgtgtac 


4800 


cacactctgg 


agagccccgt 


cgagtttcat 


cttgacggtg 


aggttctttc 


acttgacaaa 


4860 


ctaaagagtc 


tcttatccct 


gcgggaggtt 


aagactataa 


aagtgttcac 


aactgtggac 


4920 


aacactaatc 


tccacacaca 


gcttgtggat 


atgtctatga 


catatggaca 


gcagtttggt 


4980 


ccaacatact 


tggatggtgc 


tgatgttaca 


aaaattaaac 


ctcatgtaaa 


tcatgagggt 


5040 


aagactttct 


ttgtactacc 


tagtgatgac 


acactacgta 


gtgaagcttt 


cgagtactac 


5100 


catactcttg 


atgagagttt 


tcttggtagg 


tacatgtctg 


ctttaaacca 


cacaaagaaa 


5160 


tggaaatttc 


ctcaagttgg 


tggtttaact 


tcaattaaat 


gggctgataa 


caattgttat 


5220 


ttgtctagtg 


ttttattagc 


acttcaacag 


cttgaagtca 


aattcaatgc 


accagcactt 


5280 


caagaggctt 


attatagagc 


ccgtgctggt 


gatgctgcta 


acttttgtgc 


actcatactc 


5340 


gcttacagta 


ataaaactgt 


tggcgagctt 


ggtgatgtca 


gagaaactat 


gacccatctt 


5400 


ctacagcatg 


ctaatttgga 


atctgcaaag 


cgagttctta 


atgtggtgtg 


taaacattgt 


5460 


ggtcagaaaa 


ctactacctt 


aacgggtgta 


gaagctgtga 


tgtatatggg 


tactctatct 


5520 


tatgataatc 


ttaagacagg 


tgtttccatt 


ccatgtgtgt 


gtggtcgtga 


tgctacacaa 


5580 


tatctagtac 


aacaagagtc 


ttcttttgtt 


atgatgtctg 


caccacctgc 


tgagtataaa 


5640 


ttacagcaag 


gtacattctt 


atgtgcgaat 


gagtacactg 
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gtgtggtcat 
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tacactcata 


taactgctaa 


ggagaccctc 


tatcgtattg 


acggagctca 


ccttacaaag 


5760 


atgtcagagt 


acaaaggacc 


agtgactgat 


gttttctaca 


aggaaacatc 


ttacactaca 


5820 


accatcaagc 


ctgtgtcgta 


taaactcgat 


ggagttactt 


acacagagat 


tgaaccaaaa 


5880 


ttggatgggt 


attataaaaa 


ggataatgct 


tactatacag 


agcagcctat 


agaccttgta 


5940 


ccaactcaac 


cattaccaaa 


tgcgagtttt 


gataatttca 


aactcacatg 


ttctaacaca 


6000 


aaatttgctg 


atgatttaaa 


tcaaatgaca 


ggcttcacaa 


agccagcttc 


acgagagcta 


6060 


tctgtcacat 


tcttcccaga 


cttgaatggc 


gatgtagtgg 


ctattgacta 


tagacactat 


6120 


tcagcgagtt 


tcaagaaagg 


tgctaaatta 


ctgcataagc 


caattgtttg 


gcacattaac 


6180 


caggctacaa 


ccaagacaac 


gttcaaacca 


aacacttggt 


gtttacgttg 


tctttggagt 


6240 


acaaagccag 


tagatacttc 


aaattcattt 


gaagttctgg 


cagtagaaga 


cacacaagga 


6300 


atggacaatc 


ttgcttgtga 


aagtcaacaa 


cccacctctg 


aagaagtagt 


ggaaaatcct 


6360 


accatacaga 


aggaagtcat 


agagtgtgac 


gtgaaaacta 


ccgaagttgt 


aggcaatgtc 


6420 


atacttaaac 


catcagatga 


aggtgttaaa 


gtaacacaag 


agttaggtca 


tgaggatctt 


6480 


atggctgctt 


atgtggaaaa 


cacaagcatt 


accattaaga 


aacctaatga 


gctttcacta 


6540 


gccttaggtt 


taaaaacaat 


tgccactcat 


ggtattgctg 


caattaatag 


tgttccttgg 


6600 


agtaaaattt 


tggcttatgt 


caaaccattc 


ttaggacaag 


cagcaattac 


aacatcaaat 


6660 


tgcgctaaga 


gattagcaca 


acgtgtgttt 


aacaattata 


tgccttatgt 


gtttacatta 


6720 


ttgttccaat 


tgtgtacttt 


tactaaaagt 


accaattcta 


gaattagagc 


ttcactacct 


6780 


acaactattg 


ctaaaaatag 


tgttaagagt 


gttgctaaat 


tatgtttgga 


tgccggcatt 


6840 


aattatgtga 


agtcacccaa 


attttctaaa 


ttgttcacaa 


tcgctatgtg 


gctattgttg 


6900 


ttaagtattt 


gcttaggttc 


tctaatctgt 


gtaactgctg 


cttttggtgt 


actcttatct 


6960 


aattttggtg 


ctccttctta 


ttgtaatggc 


gttagagaat 


tgtatcttaa 


ttcgtctaac 


7020 


gttactacta 


tggatttctg 


tgaaggttct 


tttccttgca 


gcatttgttt 


aagtggatta 


7080 


gactcccttg 


attcttatcc 


agctcttgaa 


accattcagg 


tgacgatttc 


atcgtacaag 


7140 


ctagacttga 


caattttagg 


tctggccgct 


gagtgggttt 


tggcatatat 


gttgttcaca 


7200 


aaattctttt 


atttattagg 


tctttcagct 


ataatgcagg 


tgttctttgg 


ctattttgct 


7260 


agtcatttca 


tcagcaattc 


ttggctcatg 


tggtttatca 


ttagtattgt 


acaaatggca 


7320 


cccgtttctg 


caatggttag 


gatgtacatc 


ttctttgctt 


ctttctacta 


catatggaag 


7380 


agctatgttc 


atatcatgga 


tggttgcacc 


tcttcgactt 


gcatgatgtg 


ctataagcgc 


7440 


aatcgtgcca 


cacgcgttga 


gtgtacaact 


attgttaatg 


gcatgaagag 


atctttctat 


7500 


gtctatgcaa 


atggaggccg 


tggcttctgc 


aagactcaca 


attggaattg 


tctcaattgt 


7560 


gacacatttt 


gcactggtag 


tacattcatt 


agtgatgaag 


ttgctcgtga 


tttgtcactc 


7620 


cagtttaaaa 


gaccaatcaa 


ccctactgac 


cagtcatcgt 


atattgttga 


tagtgttgct 


7680 


gtgaaaaatg 


gcgcgcttca 


cctctacttt 


gacaaggctg 
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catccgctct cccattttgt caatttagac aatttgagag ctaacaacac taaaggttca 7800 

ctgcctatta atgtcatagt ttttgatggc aagtccaaat gcgacgagtc tgcttctaag 7860 

tctgcttctg tgtactacag tcagctgatg tgccaaccta ttctgttgct tgaccaagct 7920 

cttgtatcag acgttggaga tagtactgaa gtttccgtta agatgtttga tgcttatgtc 7980 

gacacctttt cagcaacttt tagtgttcct atggaaaaac ttaaggcact tgttgctaca 8040 

gctcacagcg agttagcaaa gggtgtagct ttagatggtg tcctttctac attcgtgtca 8100 

gctgcccgac aaggtgttgt tgataccgat gttgacacaa aggatgttat tgaatgtctc 8160 

aaactttcac atcactctga cttagaagtg acaggtgaca gttgtaacaa tttcatgctc 8220 

acctataata aggttgaaaa catgacgccc agagatcttg gcgcatgtat tgactgtaat 8280 

gcaaggcata tcaatgccca agtagcaaaa agtcacaatg tttcactcat ctggaatgta 8340 

aaagactaca tgtctttatc tgaacagctg cgtaaacaaa ttcgtagtgc tgccaagaag 8400 

aacaacatac cttttagact aacttgtgct acaactagac aggttgtcaa tgtcataact 8460 

actaaaatct cactcaaggg tggtaagatt gttagtactt gttttaaact tatgcttaag 8520 

gccacattat tgtgcgttct tgctgcattg gtttgttata tcgttatgcc agtacataca 8580 

ttgtcaatcc atgatggtta cacaaatgaa atcattggtt acaaagccat tcaggatggt 8640 

gtcactcgtg acatcatttc tactgatgat tgttttgcaa ataaacatgc tggttttgac 8700 

gcatggttta gccagcgtgg tggttcatac aaaaatgaca aaagctgccc tgtagtagct 8760 

gctatcatta caagagagat tggtttcata gtgcctggct taccgggtac tgtgctgaga 8820 

gcaatcaatg gtgacttctt gcattttcta cctcgtgttt ttagtgctgt tggcaacatt 8880 

tgctacacac cttccaaact cattgagtat agtgattttg ctacctctgc ttgcgttctt 8940 

gctgctgagt gtacaatttt taaggatgct atgggcaaac ctgtgccata ttgttatgac 9000 

actaatttgc tagagggttc tatttcttat agtgagcttc gtccagacac tcgttatgtg 9060 

cttatggatg gttccatcat acagtttcct aacacttacc tggagggttc tgttagagta 9120 

gtaacaactt ttgatgctga gtactgtaga catggtacat gcgaaaggtc agaagtaggt 9180 

atttgcctat ctaccagtgg tagatgggtt cttaataatg agcattacag agctctatca 9240 

ggagttttct gtggtgttga tgcgatgaat ctcatagcta acatctttac tcctcttgtg 9300 

caacctgtgg gtgctttaga tgtgtctgct tcagtagtgg ctggtggtat tattgccata 9360 

ttggtgactt gtgctgccta ctactttatg aaattcagac gtgtttttgg tgagtacaac 9420 

catgttgttg ctgctaatgc acttttgttt ttgatgtctt tcactatact ctgtctggta 9480 

ccagcttaca gctttctgcc gggagtctac tcagtctttt acttgtactt gacattctat 9540 

ttcaccaatg atgtttcatt cttggctcac cttcaatggt ttgccatgtt ttctcctatt 9600 

gtgccttttt ggataacagc aatctatgta ttctgtattt ctctgaagca ctgccattgg 9660 

ttctttaaca actatcttag gaaaagagtc atgtttaatg gagttacatt tagtaccttc 9720 

gaggaggctg ctttgtgtac ctttttgctc aacaaggaaa tgtacctaaa attgcgtagc 9780 
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gagacactgt 


tgccacttac 


acagtataac 


aggtatcttg 


ctctatataa 


caagtacaag 


9840 


tatttcagtg 


gagccttaga 


tactaccagc 


tatcgtgaag 


cagcttgetg 


ccacttagca 


9900 


aaggctctaa 


atgactttag 


caactcaggt 


gctgatgttc 


tctaccaacc 


accacagaca 


9960 


tcaatcactt 


ctgctgttct 


gcagagtggt 


tttaggaaaa 


tggcattccc 


gtcaggcaaa 


10020 


gttgaagggt 


gcatggtaca 


agtaacctgt 


ggaactacaa 


ctcttaatgg 


attgtggttg 


10080 


gatgacacag 


tatactgtcc 


aagacatgtc 


atttgeacag 


cagaagacat 


gcttaatcct 


10140 


aactatgaag 


atctgctcat 


tcgcaaatcc 


aaccatagct 


ttcttgttca 


ggctggcaat 


10200 


gttcaacttc 


gtgttattgg 


ccattctatg 


caaaattgtc 


tgettagget 


taaagttgat 


10260 


acttctaacc 


ctaagacacc 


caagtataaa 


tttgtccgta 


tccaacctgg 


tcaaacattt 


10320 


tcagttctag 


catgctacaa 


tggtt caeca 


tctggtgttt 


atcagtgtgc 


catgagacct 


10380 


aatcatacca 


ttaaaggttc 


tttccttaat 


ggatcatgtg 


gtagtgttgg 


ttttaacatt 


10440 


gattatgatt 


gcgtgtcttt 


ctgctatatg 


catcatatgg 


agcttccaac 


aggagtacac 


10500 


gctggtactg 


acttagaagg 


taaattctat 


ggtccatttg 


ttgacagaca 


aactgeacag 


10560 


gctgcaggta 


cagacacaac 


cataacatta 


aatgttttgg 


catggctgta 


tgctgctgtt 


10620 


atcaatggtg 


ataggtggtt 


tcttaataga 


ttcaccacta 


ctttgaatga 


ctttaacctt 


10680 


gtggcaatga 


agtacaacta 


tgaacctttg 


acacaagatc 


atgttgacat 


attgggacct 


10740 


ctttctgctc 


aaacaggaat 


tgeegtctta 


gatatgtgtg 


ctgctttgaa 


agagctgetg 


10800 


cagaatggta 


tgaatggtcg 


tactatcctt 


ggtagcacta 


ttttagaaga 


tgagtttaca 


10860 


ccatttgatg 


ttgttagaca 


atgctctggt 


gttaccttcc 


aaggtaagtt 


caagaaaatt 


10920 


gttaagggca 


ctcatcattg 


gatgetttta 


actttcttga 


catcactatt 


gattcttgtt 


10980 


caaagtacac 


agtggtcact 


gtttttcttt 


gtttacgaga 


atgetttett 


gecatttact 


11040 


cttggtatta 


tggcaattgc 


tgcatgtgct 


atgctgcttg 


ttaagcataa 


gcacgcattc 


11100 


ttgtgcttgt 


ttctgttacc 


ttctcttgea 


acagttgett 


actttaatat 


ggtctacatg 


11160 


cctgctagct 


gggtgatgcg 


tatcatgaca 


tggcttgaat 


tggctgacac 


tagcttgtct 


11220 


ggttataggc 


ttaaggattg 


tgttatgtat 


gcttcagctt 


tagttttget 


tattctcatg 


11280 


acagctcgca 


ctgtttatga 


tgatgetget 


agacgtgttt 


ggacactgat 


gaatgtcatt 


11340 


acacttgttt 


acaaagtcta 


ctatggtaat 


gctttagatc 


aagctatttc 


catgtgggcc 


11400 


ttagttattt 


ctgtaacctc 


taactattct 


ggtgtcgtta 


cgactatcat 


gtttttagct 


11460 


agagctatag 


tgtttgtgtg 


tgttgagtat 


tacccattgt 


tatttattac 


tggcaacacc 


11520 


ttacagtgta 


tcatgcttgt 


ttattgtttc 


ttaggctatt 


gttgctgctg 


ctactttggc 


11580 


cttttctgtt 


tactcaaccg 


ttacttcagg 


cttactcttg 


gtgtttatga 


ctacttggtc 


11640 


tctacacaag 


aatttaggta 


tatgaactcc 


caggggcttt 


tgcctcctaa 


gagtagtatt 


11700 


gatgctttca 


agcttaacat 


taagttgttg 


ggtattggag 


gtaaaccatg 


tatcaaggtt 


11760 


gctactgtac 


agtctaaaat 


gtctgacgta 


aagtgcacat 
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:ttcaacaac 


ttagagtaga 


gtcatcttct aaattgtggg 


cacaatgtgt 


aL d d L, L l. L. ci l> 


11880 


aatgatattc ttcttgcaaa 


agacacaact 


gaagctttcg 


agaagatggt 


■t-1" r *t* r 1" f +* *t* o 

LULUt LLLLy 


11940 


tctgttttgc tatccatgca 


gggtgctgta gacattaata ggttgtgcga 


nnaaatflrtr 


12000 


gataaccgtg 


ctactcttca 


ggctattgct 


tcagaattta 


gttctttacc 


atratatnrr 


12060 


gcttatgcca ctgcccagga 


ggcctatgag 


caggctgtag 


ctaatggtga 


l ll, xyddy ll. 


12120 


gttctcaaaa agttaaagaa 


atctttgaat 


gtggctaaat 


ctgagtttga 


v_ t_y tya Lyt L 


12180 


gccatgcaac gcaagttgga 


aaagatggca gatcaggcta tgacccaaat 


y UaLaaaLay 


12240 


gcaagatctg 


aggacaagag 


ggcaaaagta actagtgcta tgcaaacaat 




12300 


atgcttagga agcttgataa 


tgatgcactt 


aacaacatta 


tcaacaatgc 


y v_y Lyotyy l 


12360 

J- 1- j w w 


tgtgttccac 


tcaacatcat 


accattgact acagcagcca aactcatggt 


i~ ci t* t* n t* c r cV 


12420 


gattatggta 


cctacaagaa 


cacttgtgat 


ggtaacacct 


ttacatatgc 


CtLV.Lyv-.dV_ LL. 


12480 


tgggaaatcc agcaagttgt 


tgatgcggat 


agcaagattg 


ttcaacttag 




12540 


atggacaatt 


caccaaattt 


ggcttggcct 


cttattgtta 


cagctctaag 


anrraartra 

dy L,L.dd v_ L V- d 


12600 


gctgttaaac tacagaataa 


tgaactgagt 


ccagtagcac 


tacgacagat 


y Lv-v. Ly Ly v.y 


12660 


gctggtacca 


cacaaacagc 


ttgtactgat 


gacaatgcac 


ttgcctacta 


taaraattrn 

Ld.dL.Clcl L LLy 


12720 

JL£_ t t—\J 


aagggaggta 


ggtttgtgct 


ggcattacta tcagaccacc aagatctcaa 


a1"nnnr1"afi3 
d Lyyy L, Layci 


12780 


ttccctaaga gtgatggtac 


aggtacaatt 


tacacagaac 


tggaaccacc 


L Ly Lay y lll 


12840 


gttacagaca 


caccaaaagg 


gcctaaagtg 


aaatacttgt. 


acttcatcaa 


annrttaaar 
ctyy v. l uaaav. 


12900 


aacctaaata 


gaggtatggt 


gctgggcagt 


ttagctgcta 


cagtacgtct 


LL.ciyyL. Lyya 


12960 


aatgctacag 


aagtacctgc 


caattcaact 


gtgctttcct 


tctgtgcttt 


Ly v_ciy Layat 


13020 


cctgctaaag 


catataagga 


ttacctagca 


agtggaggac 


aaccaatcac 


v_ cxct l, Ly ty ty 


13080 


aagatgttgt 


gtacacacac 


tggtacagga 


caggcaatta 


ctgtaacacc 


ay aay v. Lac* v> 


13140 


atggaccaag 


agtcctttgg 


tggtgcttca 


tgttgtctgt 


attgtagatg 


rrarattnar 


13200 


catccaaatc 


ctaaaggatt 


ctgtgacttg 


aaaggtaagt 


acgtccaaat 


acrtaccact 


13260 


tgtgctaatg 


acccagtggg 


ttttacactt 


agaaacacag 


tctgtaccgt 


rtnrnnaato 
l. Ly v.yycia Ly 


13320 


tggaaaggtt 


atggctgtag 


ttgtgaccaa 


ctccgcgaac 


ccttgatgca 


y LL.LyL.yy a. l 


13380 

XJ JUU 


gcatcaacgt 


ttttaaacgg 


gtttgcggtg 


taagtgcagc 


ccgtcttaca 


L,L.y Ly L.yy lci 


13440 


caggcactag 


tactgatgtc 


gtctacaggg 


cttttgatat 


ttacaacgaa 


actay l Ly l. Ly 


13500 


gttttgcaaa gttcctaaaa 


actaattgct gtcgcttcca ggagaaggat 


yo.yyddyyv-.ci 


13560 


atttattaga 


ctcttacttt 


gtagttaaga ggcatactat gtctaactac 


caacatgaag 


*i s con 


agactattta 


taacttggtt 


aaagattgtc cagcggttgc tgtccatgac 


tttttcaagt 


13680 


ttagagtaga tggtgacatg 


gtaccacata tatcacgtca gcgtctaact 


aaatacacaa 


13740 


tggctgattt 


agtctatgct 


ctacgtcatt ttgatgaggg taattgtgat 


acattaaaag 


13800 


aaatactcgt 


cacatacaat 


tgctgtgatg 


atgattattt 


caataagaag 


gattggtatg 


13860 
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acttcgtaga gaatcctgac atcttacgcg tatatgctaa cttaggtgag cgtgtacgcc 13920 

aatcattatt aaagactgta caattctgcg atgctatgcg tgatgcaggc attgtaggcg 13980 

tactgacatt agataatcag gatcttaatg ggaactggta cgatttcggt gatttcgtac 14040 

aagtagcacc aggctgcgga gttcctattg tggattcata ttactcattg ctgatgccca 14100 

tcctcacttt gactagggca ttggctgctg agtcccatat ggatgctgat *ctcgcaaaac 14160 

cacttattaa gtgggatttg ctgaaatatg attttacgga agagagactt tgtctcttcg 14220 

accgttattt taaatattgg gaccagacat accatcccaa ttgtattaac tgtttggatg 14280 

ataggtgtat ccttcattgt gcaaacttta atgtgttatt ttctactgtg tttccaccta 14340 

caagttttgg accactagta agaaaaatat ttgtagatgg tgttcctttt gttgtttcaa 14400 

ctggatacca ttttcgtgag ttaggagtcg tacataatca ggatgtaaac ttacatagct 14460 

cgcgtctcag tttcaaggaa cttttagtgt atgctgctga tccagctatg catgcagctt 14520 

ctggcaattt attgctagat aaacgcacta catgcttttc agtagctgca ctaacaaaca 14580 

atgttgcttt tcaaactgtc aaacccggta attttaataa agacttttat gactttgctg 14640 

tgtctaaagg tttctttaag gaaggaagtt ctgttgaact aaaacacttc ttctttgctc 14700 

aggatggcaa cgctgctatc agtgattatg actattatcg ttataatctg ccaacaatgt 14760 

gtgatatcag acaactccta ttcgtagttg aagttgttga taaatacttt gattgttacg 14820 

atggtggctg tattaatgcc aaccaagtaa tcgttaacaa tctggataaa tcagctggtt 14880 

tcccatttaa taaatggggt aaggctagac tttattatga ctcaatgagt tatgaggatc 14940 

aagatgcact tttcgcgtat actaagcgta atgtcatccc tactataact caaatgaatc 15000 

ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc tctatctgta 15060 

gtactatgac aaatagacag tttcatcaga aattattgaa gtcaatagcc gccactagag 15120 

gagctactgt ggtaattgga acaagcaagt tttacggtgg ctggcataat atgttaaaaa 15180 

ctgtttacag tgatgtagaa actccacacc ttatgggttg ggattatcca aaatgtgaca 15240 

gagccatgcc taacatgctt aggataatgg cctctcttgt tcttgctcgc aaacataaca 15300 

cttgctgtaa cttatcacac cgtttctaca ggttagctaa cgagtgtgcg caagtattaa 15360 

gtgagatggt catgtgtggc ggctcactat atgttaaacc aggtggaaca tcatccggtg 15420 

atgctacaac tgcttatgct aatagtgtct ttaacatttg tcaagctgtt acagccaatg 15480 

taaatgcact tctttcaact gatggtaata agatagctga caagtatgtc cgcaatctac 15540 

aacacaggct ctatgagtgt ctctatagaa atagggatgt tgatcatgaa ttcgtggatg 15600 

agttttacgc ttacctgcgt aaacatttct ccatgatgat tctttctgat gatgccgttg 15660 

tgtgctataa cagtaactat gcggctcaag gtttagtagc tagcattaag aactttaagg 15720 

cagttcttta ttatcaaaat aatgtgttca tgtctgaggc aaaatgttgg actgagactg 15780 

accttactaa aggacctcac gaattttgct cacagcatac aatgctagtt aaacaaggag 15840 

atgattacgt gtacctgcct tacccagatc catcaagaat attaggcgca ggctgttttg 15900 
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tcgatgatat 


tgtcaaaaca 


gatggtacac 


ttatgattga 


aaggttcgtg 


tcactggcta 


15960 


ttgatgctta 


cccacttaca 


aaacatccta 


atcaggagta 


tgctgatgtc 


tttcacttgt 


16020 


atttacaata 


cattagaaag 


ttacatgatg 


agcttactgg 


ccacatgttg 


gacatgtatt 


16080 


ccgtaatgct 


aactaatgat 


aacacctcac 


ggtactggga 


acctgagttt 


tatgaggcta 


16140 


tgtacacacc 


acatacagtc 


ttgcaggctg 


taggtgcttg 


tgtattgtgc 


aattcacaga 


16200 


cttcacttcg 


ttgcggtgcc 


tgtattagga 


gaccattcct 


atgttgcaag 


tgctgctatg 


16260 


accatgtcat 


ttcaacatca 


cacaaattag 


tgttgtctgt 


taatccctat 


gtttgcaatg 


16320 


ccccaggttg 


tgatgtcact 


gatgtgacac 


aactgtatct 


aggaggtatg 


agctattatt 


16380 


gcaagtcaca 


taagcctccc 


attagttttc 


cattatgtgc 


taatggtcag 


gtttttggtt 


16440 


tatacaaaaa 


cacatgtgta 


ggcagtgaca 


atgtcactga 


cttcaatgcg 


atagcaacat 


16500 


gtgattggac 


taatgctggc 


gattacatac 


ttgccaacac 


ttgtactgag 


agactcaagc 


16560 


ttttcgcagc 


agaaacgctc 


aaagccactg 


aggaaacatt 


taagctgtca 


tatggtattg 


16620 


ccactgtacg 


cgaagtactc 


tctgacagag 


aattgcatct 


ttcatgggag 


gttggaaaac 


16680 


ctagaccacc 


attgaacaga 


aactatgtct 


ttactggtta 


ccgtgtaact 


aaaaatagta 


16740 


aagtacagat 


tggagagtac 


acctttgaaa 


aaggtgacta 


tggtgatgct 


gttgtgtaca 


16800 


gaggtactac 


gacatacaag 


ttgaatgttg 


gtgattactt 


tgtgttgaca 


tctcacactg 


16860 


taatgccact 


tagtgcacct 


actctagtgc 


cacaagagca 


ctatgtgaga 


attactggct 


16920 


tgtacccaac 


actcaacatc 


tcagatgagt 


tttctagcaa 


tgttgcaaat 


tatcaaaagg 


16980 


tcggcatgca 


aaagtactct 


acactccaag 


gaccacctgg 


tactggtaag 


agtcattttg 


17040 


ccatcggact 


tgctctctat 


tacccatctg 


ctcgcatagt 


gtatacggca 


tgctctcatg 


17100 


cagctgttga 


tgccctatgt 


gaaaaggcat 


taaaatattt 


gcccatagat 


aaatgtagta 


17160 


gaatcatacc 


tgcgcgtgcg 


cgcgtagagt 


gttttgataa 


attcaaagtg 


aattcaacac 


17220 


tagaacagta 


tgttttctgc 


actgtaaatg 


cattgccaga 


aacaactgct 


gacattgtag 


17280 


tctttgatga 


aatctctatg 


gctactaatt 


atgacttgag 


tgttgtcaat 


gctagacttc 


17340 


gtgcaaaaca 


ctacgtctat 


attggcgatc 


ctgctcaatt 


accagccccc 


cgcacattgc 


17400 


tgactaaagg 


cacactagaa 


ccagaatatt 


ttaattcagt 


gtgcagactt 


atgaaaacaa 


17460 


taggtccaga 


catgttcctt 


ggaacttgtc 


gccgttgtcc 


tgctgaaatt 


gttgacactg 


17520 


tgagtgcttt 


agtttatgac 


aataagctaa 


aagcacacaa 


ggataagtca 


gctcaatgct 


17580 


tcaaaatgtt 


ctacaaaggt 


gttattacac 


atgatgtttc 


atctgcaatc 


aacagacctc 


17640 


aaataggcgt 


tgtaagagaa 


tttcttacac 


gcaatcctgc 


ttggagaaaa 


gctgttttta 


17700 


tctcacctta 


taattcacag 


aacgctgtag 


cttcaaaaat 


cttaggattg 


cctacgcaga 


17760 


ctgttgattc 


atcacagggt 


tctgaatatg 


actatgtcat 


attcacacaa 


actactgaaa 


17820 


cagcacactc 


ttgtaatgtc 


aaccgcttca 


atgtggctat 


cacaagggca 


aaaattggca 


17880 


ttttgtgcat 


aatgtctgat 


agagatcttt 


atgacaaact 


gcaatttaca 


agtctagaaa 


17940 
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taccacgtcg 


caatgtggct 


acattacaag 


cagaaaatgt 


aactggactt 


tttaaggact 


18000 


gtagtaagat 


cattactggt 


cttcatccta 


cacaggcacc 


tacacacctc 


agcgttgata 


18060 


taaagttcaa 


gactgaagga 


ttatgtgttg 


acataccagg 


cataccaaag 


gacatgacct 


18120 


accgtagact 


catctctatg 


atgggtttca 


aaatgaatta 


ccaagtcaat 


ggttacccta 


18180 


atatgtttat 


cacccgcgaa 


gaagctattc 


gtcacgttcg tgcgtggatt 


ggctttgatg 


18240 


tagagggctg 


tcatgcaact 


agagatgctg 


tgggtactaa 


cctacctctc 


cagctaggat 


18300 


tttctacagg 


tgttaactta 


gtagctgtac 


cgactggtta tgttgacact 


gaaaataaca 


18360 


cagaattcac 


cagagttaat 


gcaaaacctc 


caccaggtga 


ccagtttaaa 


catcttatac 


18420 


cactcatgta 


taaaggcttg 


ccctggaatg 


tagtgcgtat 


taagatagta 


caaatgctca 


18480 


gtgatacact 


gaaaggattg 


tcagacagag 


tcgtgttcgt 


cctttgggcg 


catggctttg 


18540 


agcttacatc 


aatgaagtac 


tttgtcaaga 


ttggacctga aagaacgtgt 


tgtctgtgtg 


18600 


acaaacgtgc 


aacttgcttt 


tctacttcat 


cagatactta tgcctgctgg 


aatcattctg 


18660 


tgggttttga 


ctatgtctat 


aacccattta 


tgattgatgt 


tcagcagtgg 


ggctttacgg 


18720 


gtaaccttca 


gagtaaccat 


gaccaacatt 


gccaggtaca tggaaatgca 


catgtggcta 


18780 


gttgtgatgc 


tatcatgact 


agatgtttag 


cagtccatga 


gtgctttgtt 


aagcgcgttg 


18840 


attggtctgt 


tgaataccct 


attataggag 


atgaactgag 


ggttaattct 


gcttgcagaa 


18900 


aagtacaaca 


catggttgtg 


aagtctgcat 


tgcttgctga 


taagtttcca 


gttcttcatg 


18960 


acattggaaa 


tccaaaggct 


atcaagtgtg 


tgcctcaggc 


tgaagtagaa 


tggaagttct 


19020 


acgatgctca 


gccatgtagt 


gacaaagctt 


acaaaataga 


ggaactcttc 


tattcttatg 


19080 


ctacacatca 


cgataaattc 


actgatggtg 


tttgtttgtt 


ttggaattgt 


aacgttgatc 


19140 


gttacccagc 


caatgcaatt 


gtgtgtaggt 


ttgacacaag 


agtcttgtca 


aacttgaact 


19200 


taccaggctg 


tgatggtggt 


agtttgtatg 


tgaataagca 


tgcattccac 


actccagctt 


19260 


tcgataaaag 


tgcatttact 


aatttaaagc 


aattgccttt 


cttttactat 


tctgatagtc 


19320 


cttgtgagtc 


tcatggcaaa 


caagtagtgt 


cggatattga 


ttatgttcca 


ctcaaatctg 


19380 


ctacgtgtat 


tacacgatgc 


aatttaggtg 


gtgctgtttg 


cagacaccat 


gcaaatgagt 


19440 


accgacagta 


cttggatgca 


tataatatga 


tgatttctgc tggatttagc 


ctatggattt 


19500 


acaaacaatt 


tgatacttat 


aacctgtgga 


atacatttac 


caggttacag 


agtttagaaa 


19560 


atgtggctta 


taatgttgtt 


aataaaggac 


actttgatgg 


acacgccggc 


gaagcacctg 


19620 


tttccatcat 


taataatgct 


gtttacacaa 


aggtagatgg 


tattgatgtg 


gagatctttg 


19680 


aaaataagac 


aacacttcct 


gttaatgttg 


catttgagct 


ttgggctaag 


cgtaacatta 


19740 


aaccagtgcc 


agagattaag 


atactcaata 


atttgggtgt tgatatcgct 


gctaatactg 


19800 


taatctggga 


ctacaaaaga 


gaagccccag 


cacatgtatc tacaataggt 


gtctgcacaa 


19860 


tgactgacat 


tgccaagaaa 


cctactgaga 


gtgcttgttc 


ttcacttact 


gtcttgtttg 


19920 


atggtagagt 


ggaaggacag 


gtagaccttt 


ttagaaacgc 


ccgtaatggt 


gttttaataa 


19980 
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cagaaggttc agtcaaaggt 


ctaacacctt 


caaagggacc 


agcacaagct 


agcgtcaatg 


20040 


gagtcacatt aattggagaa 


tcagtaaaaa 


cacagtttaa 


ctactttaag 


aaagtagacg 


20100 


gcattattca acagttgcct 


gaaacctact 


ttactcagag 


cagagactta 


gaggatttta 


20160 


agcccagatc acaaatggaa 


actgactttc 


tcgagctcgc 


tatggatgaa 


ttcatacagc 


20220 


gatataagct 


cgagggctat 


gccttcgaac 


acatcgttta 


tggagatttc 


agtcatggac 


20280 


aacttggcgg 


tcttcattta 


atgataggct 


tagccaagcg 


ctcacaagat 


tcaccactta 


20340 


aattagagga ttttatccct 


atggacagca 


cagtgaaaaa 


ttacttcata 


acagatgcgc 


20400 


aaacaggttc atcaaaatgt 


gtgtgttctg 


tgattgatct 


tttacttgat 


gactttgtcg 


20460 


agataataaa gtcacaagat 


ttgtcagtga 


tttcaaaagt 


ggtcaaggtt 


acaattgact 


20520 


atgctgaaat ttcattcatg 


ctttggtgta 


aggatggaca 


tgttgaaacc 


ttctacccaa 


20580 


aactacaagc 


aagtcaagcg 


tggcaaccag 


gtgttgcgat 


gcctaacttg 


tacaagatgc 


20640 


aaagaatgct 


tcttgaaaag 


tgtgaccttc 


agaattatgg 


tgaaaatgct 


gttataccaa 


20700 


aaggaataat gatgaatgtc 


gcaaagtata 


ctcaactgtg 


tcaatactta 


aatacactta 


20760 


ctttagctgt 


accctacaac 


atgagagtta 


ttcactttgg 


tgctggctct 


gataaaggag 


20820 


ttgcaccagg 


tacagctgtg 


ctcagacaat 


ggttgccaac 


tggcacacta 


cttgtcgatt 


20880 


cagatcttaa tgacttcgtc 


tccgacgcag 


attctacttt 


aattggagac 


tgtgcaacag 


20940 


tacatacggc 


taataaatgg 


gaccttatta 


ttagcgatat 


gtatgaccct 


aggaccaaac 


21000 


atgtgacaaa 


agagaatgac 


tctaaagaag 


ggtttttcac 


ttatctgtgt 


ggatttataa 


21060 


agcaaaaact 


agccctgggt 


ggttctatag 


ctgtaaagat 


aacagagcat 


tcttggaatg 


21120 


ctgaccttta 


caagcttatg 


ggccatttct 


catggtggac 


agcttttgtt 


acaaatgtaa 


21180 


atgcatcatc 


atcggaagca 


tttttaattg 


gggctaacta 


tcttggcaag 


ccgaaggaac 


21240 


aaattgatgg 


ctataccatg 


catgctaact 


acattttctg 


gaggaacaca 


aatcctatcc 


21300 


agttgtcttc 


ctattcactc 


tttgacatga 


gcaaatttcc 


tcttaaatta 


agaggaactg 


21360 


ctgtaatgtc 


tcttaaggag 


aatcaaatca 


atgatatgat 


ttattctctt 


ctggaaaaag 


21420 


gtaggcttat 


cattagagaa 


aacaacagag 


ttgtggtttc 


aagtgatatt 


cttgttaaca 


21480 


actaaacgaa 


catgtttatt 


ttcttattat 


ttcttactct 


cactagtggt 


agtgaccttg 


21540 


accggtgcac 


cacttttgat 


gatgttcaag 


ctcctaatta 


cactcaacat 


acttcatcta 


21600 


"tgaggggggt ttactatcct 


gatgaaattt 


ttagatcaga 


cactctttat 


ttaactcagg 


21660 


atttatttct 


tccattttat 


tctaatgtta 


cagggtttca 


tactattaat 


catacgtttg 


21720 


gcaaccctgt 


catacctttt 


aaggatggta 


tttattttgc 


tgccacagag 


aaatcaaatg 


21780 


ttgtccgtgg ttgggttttt 


ggttctacca 


tgaacaacaa 


gtcacagtcg 


gtgattatta 


21840 


ttaacaattc tactaatgtt 


gttatacgag 


catgtaactt 


tgaattgtgt 


gacaaccctt 


21900 


tctttgctgt ttctaaaccc 


atgggtacac 


agacacatac 


tatgatattc 


gataatgcat 


21960 


ttaattgcac tttcgagtac 


atatctgatg 


ccttttcgct 


tgatgtttca 


gaaaagtcag 


22020 
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gtaattttaa acacttacga gagtttgtgt ttaaaaataa agatgggttt ctctatgttt 22080 

ataagggcta tcaacctata gatgtagttc gtgatctacc ttctggtttt aacactttga 22140 

aacctatttt taagttgcct cttggtatta acattacaaa ttttagagcc attcrtacag 22200 

ccttttcacc tgctcaagac atttggggca cgtcagctgc agcctatttt gttggctatt 22260 

taaagccaac tacatttatg ctcaagtatg atgaaaatgg tacaatcaca gatgctgttg 22320 

attgttctca aaatccactt gctgaactca aatgctctgt taagagcttt gagattgaca 22380 

aaggaattta ccagacctct aatttcaggg ttgttccctc aggagatgtt gtgagattcc 22440 

ctaatattac aaacttgtgt ccttttggag aggtttttaa tgctactaaa ttcccttctg 22500 

tctatgcatg ggagagaaaa aaaatttcta attgtgttgc tgattactct gtgctctaca 22560 

actcaacatt tttttcaacc tttaagtgct atggcgtttc tgccactaag ttgaatgatc 22620 

tttgcttctc caatgtctat gcagattctt ttgtagtcaa gggagatgat gtaagacaaa 22680 

tagcgccagg acaaactggt gttattgctg attataatta taaattgcca gatgatttca 22740 

tgggttgtgt ccttgcttgg aatactagga acattgatgc tacttcaact ggtaattata 22800 

attataaata taggtatctt agacatggca agcttaggcc ctttgagaga gacatatcta 22860 

atgtgccttt ctcccctgat ggcaaacctt gcaccccacc tgctcttaat tgttattggc 22920 

cattaaatga ttatggtttt tacaccacta ctggcattgg ctaccaacct tacagagttg 22980 

tagtactttc ttttgaactt ttaaatgcac cggccacggt ttgtggacca aaattatcca 23040 

ctgaccttat taagaaccag tgtgtcaatt ttaattttaa tggactcact ggtactggtg 23100 

tgttaactcc ttcttcaaag agatttcaac catttcaaca atttggccgt gatgtttctg 23160 

atttcactga ttccgttcga gatcctaaaa catctgaaat attagacatt tcaccttgct 23220 

cttttggggg tgtaagtgta attacacctg gaacaaatgc ttcatctgaa gttgctgttc 23280 

tatatcaaga tgttaactgc actgatgttt ctacagcaat tcatgcagat caactcacac 23340 

cagcttggcg catatattct actggaaaca atgtattcca gactcaagca ggctgtctta 23400 

taggagctga gcatgtcgac acttcttatg agtgcgacat tcctattgga gctggcattt 23460 

gtgctagtta ccatacagtt tctttattac gtagtactag ccaaaaatct attgtggctt 23520 

atactatgtc tttaggtgct gatagttcaa ttgcttactc taataacacc attgctatac 23580 

ctactaactt ttcaattagc attactacag aagtaatgcc tgtttctatg gctaaaacct 23640 

ccgtagattg taatatgtac atctgcggag attctactga atgtgctaat ttgcttctcc 23700 

aatatggtag cttttgcaca caactaaatc gtgcactctc aggtattgct gctgaacagg 23760 

atcgcaacac acgtgaagtg ttcgctcaag tcaaacaaat gtacaaaacc ccaactttga 23820 

aatattttgg tggttttaat ttttcacaaa tattacctga ccctctaaag ccaactaaga 23880 

ggtcttttat tgaggacttg ctctttaata aggtgacact cgctgatgct ggcttcatga 23940 

agcaatatgg cgaatgccta ggtgatatta atgctagaga tctcatttgt gcgcagaagt 24000 

tcaatggact tacagtgttg ccacctctgc tcactgatga tatgattgct gcctacactg 24060 
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ctgctctagt tagtggtact gccactgctg gatggacatt tggtgctggc gctgctcttc 24120 

aaataccttt tgctatgcaa atggcatata ggttcaatgg cattggagtt acccaaaatg 24180 

ttctctatga gaaccaaaaa caaatcgcca accaatttaa caaggcgatt agtcaaattc 24240 

aagaatcact tacaacaaca tcaactgcat tgggcaagct gcaagacgtt gttaaccaga 24300 

atgctcaagc attaaacaca cttgttaaac aacttagctc taattttggt gcaatttcaa 24360 

gtgtgctaaa tgatatcctt tcgcgacttg ataaagtcga ggcggaggta caaattgaca 24420 

ggttaattac aggcagactt caaagccttc aaacctatgt aacacaacaa ctaatcaggg 24480 

ctgctgaaat cagggcttct gctaatcttg ctgctactaa aatgtctgag tgtgttcttg 24540 

gacaatcaaa aagagttgac ttttgtggaa agggctacca ccttatgtcc ttcccacaag 24600 

cagccccgca tggtgttgtc ttcctacatg tcacgtatgt gccatcccag gagaggaact 24660 

tcaccacagc gccagcaatt tgtcatgaag gcaaagcata cttccctcgt gaaggtgttt 24720 

ttgtgtttaa tggcacttct tggtttatta cacagaggaa cttcttttct ccacaaataa 24780 

ttactacaga caatacattt gtctcaggaa attgtgatgt cgttattggc atcattaaca 24840 

acacagttta tgatcctctg caacctgagc ttgactcatt caaagaagag ctggacaagt 24900 

acttcaaaaa tcatacatca ccagatgttg atcttggcga catttcaggc attaacgctt 24960 

ctgtcgtcaa cattcaaaaa gaaattgacc gcctcaatga ggtcgctaaa aatttaaatg 25020 

aatcactcat tgaccttcaa gaattgggaa aatatgagca atatattaaa tggccttggt 25080 

atgtttggct cggcttcatt gctggactaa ttgccatcgt catggttaca atcttgcttt 25140 

gttgcatgac tagttgttgc agttgcctca agggtgcatg ctcttgtggt tcttgctgca 25200 

agtttgatga ggatgactct gagccagttc tcaagggtgt caaattacat tacacataaa 25260 

cgaacttatg gatttgttta tgagattttt tactcttgga tcaattactg cacagccagt 25320 

aaaaattgac aatgcttctc ctgcaagtac tgttcatgct acagcaacga taccgctaca 25380 

agcctcactc cctttcggat ggcttgttat tggcgttgca tttcttgctg tttttcagag 25440 

cgctaccaaa ataattgcgc tcaataaaag atggcagcta gccctttata agggcttcca 25500 

gttcatttgc aatttactgc tgctatttgt taccatctat tcacatcttt tgcttgtcgc 25560 

tgcaggtatg gaggcgcaat ttttgtacct ctatgccttg atatattttc tacaatgcat 25620 

caacgcatgt agaattatta tgagatgttg gctttgttgg aagtgcaaat ccaagaaccc 25680 

attactttat gatgccaact actttgtttg ctggcacaca cataactatg actactgtat 25740 

accatataac agtgtcacag atacaattgt cgttactgaa ggtgacggca tttcaacacc 25800 

aaaactcaaa gaagactacc aaattggtgg ttattctgag gataggcact caggtgttaa 25860 

agactatgtc gttgtacatg gctatttcac cgaagtttac taccagcttg agtctacaca 25920 

aattactaca gacactggta ttgaaaatgc tacattcttc atctttaaca agcttgttaa 25980 

agacccaccg aatgtgcaaa tacacacaat cgacggctct tcaggagttg ctaatccagc 26040 

aatggatcca atttatgatg agccgacgac gactactagc gtgcctttgt aagcacaaga 26100 
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aagtgagtac gaacttatgt actcattcgt ttcggaagaa acaggtacgt taatagttaa 26160 

tagcgtactt ctttttcttg ctttcgtggt attcttgcta gtcacactag ccatccttac 26220 

tgcgcttcga ttgtgtgcgt actgctgcaa tattgttaac gtgagtttag taaaaccaac 26280 

ggtttacgtc tactcgcgtg ttaaaaatct gaactcttct gaaggagttc ctgatcttct 26340 

ggtctaaacg aactaactat tattattatt ctgtttggaa ctttaacatt gcttatcatg 26400 

gcagacaacg gtactattac cgttgaggag cttaaacaac tcctggaaca atggaaccta 26460 

gtaataggtt tcctattcct agcctggatt atgttactac aatttgccta ttctaatcgg 26520 

aacaggtttt tgtacataat aaagcttgtt ttcctctggc tcttgtggcc agtaacactt 26580 

gcttgttttg tgcttgctgc tgtctacaga attaattggg tgactggcgg gattgcgatt 26640 

gcaatggctt gtattgtagg cttgatgtgg cttagctact tcgttgcttc cttcaggctg 26700 

tttgctcgta cccgctcaat gtggtcattc aacccagaaa caaacattct tctcaatgtg 26760 

cctctccggg ggacaattgt gaccagaccg ctcatggaaa gtgaacttgt cattggtgct 26820 

gtgatcattc gtggtcactt gcgaatggcc ggacactccc tagggcgctg tgacattaag 26880 

gacctgccaa aagagatcac tgtggctaca tcacgaacgc tttcttatta caaattagga 26940 

gcgtcgcagc gtgtaggcac tgattcaggt tttgctgcat acaaccgcta ccgtattgga 27000 

aactataaat taaatacaga ccacgccggt agcaacgaca atattgcttt gctagtacag 27060 

taagtgacaa cagatgtttc atcttgttga cttccaggtt acaatagcag agatattgat 27120 

tatcattatg aggactttca ggattgctat ttggaatctt gacgttataa taagttcaat 27180 

agtgagacaa ttatttaagc ctctaactaa gaagaattat tcggagttag atgatgaaga 27240 

acctatggag ttagattatc cataaaacga acatgaaaat tattctcttc ctgacattga 27300 

ttgtatttac atcttgcgag ctatatcact atcaggagtg tgttagaggt acgactgtac 27360 

tactaaaaga accttgccca tcaggaacat acgagggcaa ttcaccattt caccctcttg 27420 

ctgacaataa atttgcacta acttgcacta gcacacactt tgcttttgct tgtgctgacg 27480 

gtactcgaca tacctatcag ctgcgtgcaa gatcagtttc accaaaactt ttcatcagac 27540 

aagaggaggt tcaacaagag ctctactcgc cactttttct cattgttgct gctctagtat 27600 

ttttaatact ttgcttcacc attaagagaa agacagaatg aatgagctca ctttaattga 27660 

cttctatttg tgctttttag cctttctgct attccttgtt ttaataatgc ttattatatt 27720 

ttggttttca ctcgaaatcc aggatctaga agaaccttgt accaaagtct aaacgaacat 27780 

gaaacttctc attgttttga cttgtatttc tctatgcagt tgcatatgca ctgtagtaca 27840 

gcgctgtgca tctaataaac ctcatgtgct tgaagatcct tgtaaggtac aacactaggg 27900 

gtaatactta tagcactgct tggctttgtg ctctaggaaa ggttttacct tttcatagat 27960 

ggcacactat ggttcaaaca tgcacaccta atgttactat caactgtcaa gatccagctg 28020 

gtggtgcgct tatagctagg tgttggtacc ttcatgaagg tcaccaaact gctgcattta 28080 

gagacgtact tgttgtttta aataaacgaa caaattaaaa tgtctgataa tggaccccaa 28140 
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tcaaaccaac 


gtagtgcccc 


ccgcattaca tttggtggac 


ccacagattc 


aactgacaat 


28200 


aaccagaatg 


gaggacgcaa 


tggggcaagg 


ccaaaacagc 


gccgacccca 


aggtttaccc 


28260 


aataatactg 


cgtcttggtt 


cacagctctc actcagcatg 


gcaaggagga 


acttagattc 


28320 


cctcgaggcc 


agggcgttcc 


aatcaacacc 


aatagtggtc 


cagatgacca 


aattggctac 


28380 


taccgaagag 


ctacccgacg 


agttcgtggt 


ggtgacggca 


aaatgaaaga 


gctcagcccc 


28440 


agatggtact 


tctattacct 


aggaactggc 


ccagaagctt 


cacttcccta 


cggcgctaac 


28500 


aaagaaggca 


tcgtatgggt 


tgcaactgag 


ggagccttga 


atacacccaa 


agaccacatt 


28560 


ggcacccgca 


atcctaataa 


caatgctgcc 


accgtgctac 


aacttcctca 


aggaacaaca 


28620 


ttgccaaaag 


gcttctacgc 


agagggaagc 


agaggcggca 


gtcaagcctc 


ttctcgctcc 


28680 


tcatcacgta 


gtcgcggtaa 


ttcaagaaat 


tcaactcctg 


gcagcagtag 


gggaaattct 


28740 


cctgctcgaa 


tggctagcgg 


aggtggtgaa actgccctcg 


cgctattgct 


gctagacaga 


28800 


ttgaaccagc 


ttgagagcaa 


agtttctggt 


aaaggccaac 


aacaacaagg 


ccaaactgtc 


28860 


actaagaaat 


ctgctgctga 


ggcatctaaa 


aagcctcgcc 


aaaaacgtac 


tgccacaaaa 


28920 


cagtacaacg 


tcactcaagc 


atttgggaga 


cgtggtccag 


aacaaaccca 


aggaaatttc 


28980 


ggggaccaag 


acctaatcag 


acaaggaact 


gattacaaac 


attggccgca 


aattgcacaa 


29040 


tttgctccaa 


gtgcctctgc 


attctttgga 


atgtcacgca 


ttggcatgga 


agtcacacct 


29100 


tcgggaacat 


ggctgactta 


tcatggagcc 


attaaattgg 


atgacaaaga 


tccacaattc 


29160 


aaagacaacg 


tcatactgct 


gaacaagcac 


attgacgcat 


acaaaacatt 


cccaccaaca 


29220 


gagcctaaaa 


aggacaaaaa 


gaaaaagact 


gatgaagctc 


agcctttgcc 


gcagagacaa 


29280 


aagaagcagc 


ccactgtgac 


tcttcttcct 


gcggctgaca 


tggatgattt 


ctccagacaa 


29340 


cttcaaaatt 


ccatgagtgg 


agcttctgct 


gattcaactc 


aggcataaac 


actcatgatg 


29400 


accacacaag 


gcagatgggc 


tatgtaaacg ttttcgcaat 


tccgtttacg 


atacatagtc 


29460 


tactcttgtg 


cagaatgaat 


tctcgtaact 


aaacagcaca 


agtaggttta 


gttaacttta 


29520 


atctcacata 


gcaatcttta 


atcaatgtgt 


aacattaggg 


aggacttgaa agagccacca 


29580 


cattttcatc 


gaggccacgc 


ggagtacgat 


cgagggtaca 


gtgaataatg 


ctagggagag 


29640 


ctgcctatat 


ggaagagccc 


taatgtgtaa 


aattaatttt 


agtagtgcta 


tccccatgtg 


29700 


attttaatag 


cttcttagga 


gaatgacaaa aaaaaaaaaa 


aaaaaa 




29746 



<210> 2 

<211> 3945 

<212> DNA 

<213> CORONAVIRUS 

<220> 
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<221> CDS 

<222> (89)..C3853) 

<223> 



<400> 2 

ttctcttctg gaaaaaggta ggcttatcat tagagaaaac aacagagttg tggtttcaag 60 

tgatattctt gttaacaact aaacgaac atg ttt att ttc tta tta ttt ctt 112 

Met Phe He Phe Leu Leu Phe Leu 
1 5 



ttc ttt get gtt tct aaa ccc atg ggt aca cag aca cat act atg ata 
Phe Phe Ala Val Ser Lys Pro Met Gly Thr Gin Thr His Thr Met He 
140 145 150 



160 



208 



act etc act agt ggt agt gac ctt gac egg tgc acc act ttt gat gat 

Thr Leu Thr Ser Gly Ser Asp Leu Asp Arg cys Thr Thr Phe Asp Asp 

10 15 20 

gtt caa get cct aat tac act caa cat act tea tct atg agg ggg gtt 

Val Gin Ala Pro Asn Tyr Thr Gin His Thr ser Ser Met Arg Gly Val 

25 30 35 40 

tac tat cct gat gaa att ttt aga tea gac act ctt tat tta act cag 256 

Tyr Tyr Pro Asp Glu lie Phe Arg Ser Asp Thr Leu Tyr Leu Thr Gin 

45 50 55 

gat tta ttt ctt cca ttt tat tct aat gtt aca ggg ttt cat act att 304 

Asp Leu Phe Leu Pro Phe Tyr Ser Asn Val Thr Gly Phe His Thr lie 
60 65 70 

aat cat acg ttt ggc aac cct gtc ata cct ttt aag gat ggt att tat 352 

Asn His Thr Phe Gly Asn Pro val lie Pro Phe Lys Asp Gly lie Tyr 

75 80 85 

ttt get gee aca gag aaa tea aat gtt gtc cgt ggt tgg gtt ttt ggt 400 

Phe Ala Ala Thr Glu Lys ser Asn val Val Arg Gly Trp val Phe Gly 

90 95 100 

tct acc atg aac aac aag tea cag teg gtg att att att aac aat tct 448 

Ser Thr Met Asn Asn Lys ser Gin ser Val lie lie lie Asn Asn ser 

105 110 115 120 

act aat gtt gtt ata cga gca tgt aac ttt gaa ttg tgt gac aac cct 496 

Thr Asn Val Val lie Arg Ala Cys Asn Phe Glu Leu cys Asp Asn Pro 

125 130 135 



544 



ttc gat aat gca ttt aat tgc act ttc gag tac ata tct gat gee ttt 592 

Phe Asp Asn Ala Phe Asn Cys Thr Phe Glu Tyr lie ser Asp Ala Phe 

155 160 165 

teg ctt gat gtt tea gaa aag tea ggt aat ttt aaa cac tta cga gag 640 

ser Leu Asp val ser Glu Lys ser Gly Asn Phe Lys His Leu Arg Glu 
170 175 180 

ttt gtg ttt aaa aat aaa gat ggg ttt etc tat gtt tat aag ggc tat 688 

Phe val Phe Lys Asn Lys Asp Gly Phe Leu Tyr val Tyr Lys Gly Tyr 
185 190 195 200 

caa cct ata gat gta gtt cgt gat eta cct tct ggt ttt aac act ttg 736 

Gin pro lie Asp val val Arg Asp Leu pro ser Gly Phe Asn Thr Leu 
205 210 215 

aaa cct att ttt aag ttg cct ctt ggt att aac att aca aat ttt aga 784 
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Lys Pro lie Phe Lys Leu Pro Leu Gly lie Asn lie Thr Asn Phe Arg 
220 225 230 

gcc att ctt aca gcc ttt tea cct get caa gac att tgg ggc acg tea 832 
Ala lie Leu Thr Ala Phe Ser pro Ala Gin Asp lie Trp Gly Thr Ser 
235 240 245 

get gca gcc tat ttt gtt ggc tat tta aag cca act aca ttt atg etc 880 
Ala Ala Ala Tyr Phe Val Gly Tyr Leu Lys Pro Thr Thr Phe Met Leu 
250 255 260 

aag tat gat gaa aat ggt aca ate aca gat get gtt gat tgt tct caa 928 
Lys Tyr Asp Glu Asn Gly Thr lie Thr Asp Ala Val Asp Cys Ser Gin 
265 270 275 280 

aat cca ctt get gaa etc aaa tgc tct gtt aag age ttt gag att gac 976 
Asn Pro Leu Ala Glu Leu Lys cys Ser Val Lys Ser Phe Glu lie Asp 
285 290 295 

aaa gga att tac cag ace tct aat ttc agg gtt gtt ccc tea gga gat 1024 
Lys Gly lie Tyr Gin Thr ser Asn Phe Arg val Val Pro Ser Gly Asp 
300 305 310 

gtt gtg aga ttc cct aat att aca aac ttg tgt cct ttt gga gag gtt 1072 
Val VaT Arg Phe Pro Asn lie Thr Asn Leu cys Pro Phe Gly Glu Val 
315 320 325 

ttt aat get act aaa ttc cct tct gtc tat gca tgg gag aga aaa aaa 1120 
Phe Asn Ala Thr Lys Phe Pro ser Val Tyr Ala Trp Glu Arg Lys Lys 
330 335 340 

att tct aat tgt gtt get gat tac tct gtg etc tac aac tea aca ttt 1168 
lie ser Asn cys val Ala Asp Tyr ser Val Leu Tyr Asn ser Thr Phe 
345 350 355 360 

ttt tea acc ttt aag tgc tat ggc gtt tct gcc act aag ttg aat gat 1216 
Phe ser Thr Phe Lys Cys Tyr Gly Val ser Ala Thr Lys Leu Asn Asp 
365 370 375 

ctt tgc ttc tec aat gtc tat gca gat tct ttt gta gtc aag gga gat 1264 
Leu cys Phe ser Asn val Tyr Ala Asp Ser Phe Val Val Lys Gly Asp 
380 385 390 

gat gta aga caa ata gcg cca gga caa act ggt gtt att get gat tat 1312 
Asp val Arg Gin lie Ala Pro Gly Gin Thr Gly Val lie Ala Asp Tyr 
395 400 - 405 

aat tat aaa ttg cca gat gat ttc atg ggt tgt gtc ctt get tgg aat 1360 
Asn Tyr Lys Leu Pro Asp Asp Phe Met Gly cys Val Leu Ala Trp Asn 
410 415 420 

act agg aac att gat get act tea act ggt aat tat aat tat aaa tat 1408 
Thr Arg Asn lie Asp Ala Thr Ser Thr Gly Asn Tyr Asn Tyr Lys Tyr 
425 " 430 435 440 

agg tat ctt aga cat ggc aag ctt agg ccc ttt gag aga gac ata tct 1456 
Arg Tyr Leu Arg His Gly Lys Leu Arg Pro Phe Glu Arg Asp lie ser 
445 450 455 



aat gtg cct ttc tec cct gat ggc aaa cct tgc acc cca cct get ctt 
Asn val Pro Phe ser Pro Asp Gly Lys pro cys Thr Pro Pro Ala Leu 
460 465 470 



1504 



aat tgt tat tgg cca tta aat gat tat ggt ttt tac acc act act ggc 1552 
Asn Cys Tyr Trp Pro Leu Asn Asp Tyr Gly Phe Tyr Thr Thr Thr Gly 
475 480 485 

att ggc tac caa cct tac aga gtt gta gta ctt tct ttt gaa ctt tta 1600 
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lie Gly Tyr Gin Pro Tyr Arg Val Val val Leu Ser Phe Glu Leu Leu 
490 495 500 



aat gca ccg gcc acg gtt tgt gga cca aaa tta tec act gac ctt att 

Asn Ala Pro Ala Thr val Cys Gly Pro Lys Leu Ser Thr Asp Leu lie 

505 510 515 520 

aag aac cag tgt gtc aat ttt aat ttt aat gga etc act ggt act ggt 

Lys Asn Gin cys val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly 

525 530 535 

gtg tta act cct tct tea aag aga ttt caa cca ttt caa caa ttt ggc 

val Leu Thr Pro ser ser Lys Arg Phe Gin Pro Phe Gin Gin Phe Gly 

540 545 550 



gaa ata tta gac att tea cct tgc tct ttt ggg ggt gta agt gta att 
Glu lie Leu Asp lie Ser Pro Cys Ser Phe Gly Gly Val Ser val lie 
570 575 580 



cca get tgg cgc ata tat tct act gga aac aat gta ttc cag act caa 
Pro Ala Trp Arg lie Tyr ser Thr Gly Asn Asn val Phe Gin Thr Gin 
620 625 630 

gca ggc tgt ctt ata gga get gag cat gtc gac act tct tat gag tgc 
Ala Gly cys Leu lie Gly Ala Glu His val Asp Thr Ser Tyr Glu Cys 
635 640 645 



tta tta cgt agt act age caa aaa tct att gtg get tat act atg tct 
Leu Leu Arg ser Thr ser Gin Lys Ser lie Val Ala Tyr Thr Met Ser 
665 670 675 680 



act gaa tgt get aat ttg ctt etc caa tat ggt age ttt tgc aca caa 
Thr Glu cys Ala Asn Leu Leu Leu Gin Tyr Gly Ser Phe cys Thr Gin 
730 735 740 



1648 



1696 



1744 



cgt gat gtt tct gat ttc act gat tec gtt cga gat cct aaa aca tct 1792 
Arg Asp val ser Asp Phe Thr Asp Ser val Arg Asp Pro Lys Thr ser 
555 560 y 565 



1840 



aca cct gga aca aat get tea tct gaa gtt get gtt eta tat caa gat 1888 

Thr Pro Gly Thr Asn Ala ser Ser Glu Val Ala Val Leu Tyr Gin Asp 
585 590 595 600 

gtt aac tgc act gat gtt tct aca gca att cat gca gat caa etc aca 1936 

Val Asn Cys Thr Asp val ser Thr Ala lie His Ala Asp Gin Leu Thr 

605 610 615 



1984 



2032 



gac att cct att gga get ggc att tgt get agt tac cat aca gtt tct 2080 
Asp He Pro lie Gly Ala Gly lie cys Ala Ser Tyr His Thr Val ser 
650 655 660 



2128 



tta ggt get gat agt tea att get tac tct aat aac ace att get ata 2176 
Leu Gly Ala Asp ser Ser lie Ala Tyr ser Asn Asn Thr lie Ala lie 
685 690 695 

cct act aac ttt tea att age att act aca gaa gta atg cct gtt tct 2224 
Pro Thr Asn Phe Ser lie ser lie Thr Thr Glu Val Met Pro val Ser 
700 705 710 

atg get aaa acc tec gta gat tgt aat atg tac ate tgc gga gat tct 2272 
Met Ala Lys Thr Ser Val Asp cys Asn Met Tyr lie Cys Giy Asp Ser 
715 720 725 



2320 



eta aat cgt gca etc tea ggt att get get gaa cag gat cgc aac aca 2368 

Leu Asn Arg Ala Leu Ser Gly lie Ala Ala Glu Gin Asp Arg Asn Thr 
745 750 755 760 

cgt gaa gtg ttc get caa gtc aaa caa atg tac aaa acc cca act ttg 2416 
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Thr 



Pro 



Thr 

775 



Leu 



aaa tat ttt ggt gqt ttt aat ttt tea caa ata tta cct gac cct eta 
Lys Tyr Phe Gly Gly Phe Asn Phe ser Gin lie Leu Pro Asp Pro Leu 
780 785 790 

aag cca act aag agg tct ttt att gag gac ttg etc ttt aat aag gtg 
Lys Pro Thr Lys Arg Ser Phe lie Glu Asp Leu Leu Phe Asn Lys Val 
795 800 805 

aca etc get gat get ggc ttc atg aag caa tat ggc gaa tgc eta ggt 
Thr Leu Ala Asp Ala Gly Phe Met Lys Gin Tyr Gly Glu cys Leu Gly 
810 815 820 

gat att aat get aga gat etc att tgt gcg cag aag ttc aat gga ctt 
Asp lie Asn Ala Arg Asp Leu lie cys Ala Gin Lys Phe Asn Gly Leu 
825 830 835 840 

aca gtg ttg cca cct ctg etc act gat gat atg att get gee tac act 
Thr val Leu Pro Pro Leu Leu Thr Asp Asp Met lie Ala Ala Tyr Thr 
845 850 855 

get get eta gtt agt gqt act gee act get gqa tgg aca ttt gqt get 
Ala Ala Leu Val ser Gly Thr Ala Thr Ala Gly Trp Thr Phe Gly Ala 
860 865 870 

ggc get get ctt caa ata cct ttt get atg caa atg gca tat agg ttc 
Gly Ala Ala Leu Gin lie Pro Phe Ala Met Gin Met Ala Tyr Arg Phe 
875 880 885 

aat ggc att gga gtt ace caa aat gtt etc tat gag aac caa aaa caa 
Asn Gly lie Gly val Thr Gin Asn val Leu Tyr Glu Asn Gin Lys Gin 
890 895 900 

ate gee aac caa ttt aac aag gcg att agt caa att caa gaa tea ctt 
lie Ala Asn Gin Phe Asn Lys Ala lie ser Gin lie Gin Glu ser Leu 
905 910 915 920 

aca aca aca tea act gca ttg ggc aag ctg caa gac gtt gtt aac cag 
Thr Thr Thr ser Thr Ala Leu Gly Lys Leu Gin Asp Val Val Asn Gin 
925 930 935 

aat get caa gca tta aac aca ctt gtt aaa caa ctt age tct aat ttt 
Asn Ala Gin Ala Leu Asn Thr Leu Val Lys Gin Leu ser Ser Asn Phe 



ggt gca att tea agt gtg eta aat gat ate ctt teg cga ctt gat aaa 
Gly Ala lie ser Ser Val Leu Asn Asp lie Leu Ser Arg Leu Asp Lys 
955 960 965 

gtc gag gcg gag gta caa att gac agg tta att aca ggc aga ctt caa 
val Glu Ala Glu Val Gin lie Asp Arg Leu lie Thr Gly Arg Leu Gin 
970 975 980 

age ctt caa ace tat gta aca caa caa eta ate agg get get gaa ate 
ser Leu Gin Thr Tyr Val Thr Gin Gin Leu lie Arg Ala Ala Glu lie 
985 990 995 ~ 1001 

agg get tct get aat ctt get get act aaa atg tct gag tgt gtt 
Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu cys val 
1005 1010 1015 

ctt gga caa tea aaa aga gtt gac ttt tgt gga aag ggc tac cac 
Leu Gly Gin Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His 
1020 ~ 1025 * 1030 

ctt atg tec ttc cca caa gca gee ccg cat ggt gtt gtc ttc eta 



2464 
2512 
2560 
2608 
2656 
2704 
2752 
2800 
2848 
2896 
2944 
2992 
3040 
3088 
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Leu Met Ser Phe Pro Gin Ala Ala Pro His Gly Val val Phe Leu 
1035 1040 1045 

cat gtc acg tat gtg cca tec cag gag agg aac ttc acc aca gcg 3268 
His Val Thr Tyr val Pro ser Gin Glu Arg Asn Phe Thr Thr Ala 
1050 1055 1060 

cca gca att tgt cat gaa ggc aaa gca tac ttc cct cgt gaa ggt 3313 
pro Ala lie Cys His Glu Gly Lys Ala Tyr Phe Pro Arg Glu Gly 
1065 1070 ~ 1075 

gtt ttt gtg ttt aat ggc act tct tgg ttt att aca cag agg aac 3358 
val Phe val Phe Asn Gly Thr Ser Trp Phe lie Thr Gin Arg Asn 
1080 1085 1090 

ttc ttt tct cca caa ata att act aca gac aat aca ttt gtc tea 3403 
Phe Phe ser Pro Gin lie lie Thr Thr Asp Asn Thr Phe val ser 
1095 1100 1105 

gga aat tgt gat gtc gtt att ggc ate att aac aac aca gtt tat 3448 
Gly Asn Cys Asp val Val lie Gly lie lie Asn Asn Thr Val Tyr 
1110 1115 1120 

gat cct ctg caa cct gag ctt gac tea ttc aaa gaa gag ctg gac 3493 
Asp Pro Leu Gin Pro Glu Leu Asp ser Phe Lys Glu Glu Leu Asp 
1125 1130 1135 



aag tac ttc aaa aat cat aca tea cca gat gtt gat ctt ggc gac 
Lys Tyr Phe Lys Asn His Thr Ser Pro Asp val Asp Leu Gly Asp 
1140 1145 1150 



3538 



att tea ggc att aac get tct gtc gtc aac att caa aaa gaa att 3583 
lie Ser Gly He Asn Ala Ser Val Val Asn lie Gin Lys Glu lie 
1155 1160 1165 

gac cgc etc aat gag gtc get aaa aat tta aat gaa tea etc att 3628 
Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu lie 
1170 1175 1180 

gac ctt caa gaa ttg gga aaa tat gag caa tat att aaa tgg cct 3673 
Asp Leu Gin Glu Leu Gly Lys Tyr Glu Gin Tyr lie Lys Trp Pro 
1185 1190 1195 

tgg tat gtt tgg etc ggc ttc att get gga eta att gee ate gtc 3718 
Trp Tyr val Trp Leu Gly Phe lie Ala Gly Leu He Ala lie Val 
1200 1205 1210 

atg gtt aca ate ttg ctt tgt tgc atg act agt tgt tgc agt tgc 3763 
Met val Thr lie Leu Leu cys Cys Met Thr Ser cys Cys Ser cys 
1215 1220 1225 

etc aag ggt gca tgc tct tgt ggt tct tgc tgc aag ttt gat gag 3808 
Leu Lys Gly Ala cys Ser cys Gly ser cys cys Lys Phe Asp Glu 
1230 1235 1240 

gat gac tct gag cca gtt etc aag ggt gtc aaa tta cat tac aca 3853 
Asp Asp ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr 
1245 ~ 1250 1255 

taaacgaact tatggatttg tttatgagat tttttactct tggatcaatt actgcacagc 3913 

cagtaaaaat tgacaatget tctcctgcaa gt 3945 

<210> 3 
<211> 1255 
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<212> PRT 

<213> CORONAVIRUS 



<400> 3 

Met Phe lie Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu 
15 10 15 

Asp Arg cys Thr Thr Phe Asp Asp Val Gin Ala Pro Asn Tyr Thr Gin 
20 25 30 

His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu lie Phe Arg 
35 40 45 

Ser Asp Thr Leu Tyr Leu Thr Gin Asp Leu Phe Leu Pro Phe Tyr ser 
50 55 60 

Asn Val Thr Gly Phe His Thr lie Asn His Thr Phe Gly Asn Pro val 
65 70 75 80 

lie Pro Phe Lys Asp Gly lie Tyr Phe Ala Ala Thr Glu Lys Ser Asn 
85 90 95 

Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gin 
100 105 110 

Ser val lie lie lie Asn Asn ser Thr Asn val val lie Arg Ala Cys 
115 120 125 

Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val ser Lys Pro Met 
130 135 140 

Gly Thr Gin Thr His Thr Met lie Phe Asp Asn Ala Phe Asn cys Thr 
145 150 155 160 

Phe Glu Tyr lie ser Asp Ala Phe ser Leu Asp Val ser Glu Lys ser 
165 170 175 

Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly 
180 185 190 

Phe Leu Tyr val Tyr Lys Gly Tyr Gin Pro lie Asp Val val Arg Asp 
195 200 205 

Leu Pro ser Gly Phe Asn Thr Leu Lys Pro lie Phe Lys Leu Pro Leu 
210 215 220 

Gly lie Asn lie Thr Asn Phe Arg Ala lie Leu Thr Ala Phe Ser Pro 
225 230 235 240 
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Ala Gin Asp lie Trp Gly Thr Ser Ala Ala Ala Tyr Phe val Gly Tyr 
245 250 255 

Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr lie 
260 265 270 

Thr Asp Ala Val Asp cys ser Gin Asn Pro Leu Ala Glu Leu Lys cys 
275 280 285 

ser val Lys Ser Phe Glu lie Asp Lys Gly lie Tyr Gin Thr Ser Asn 
290 295 300 

Phe Arg Val val Pro Ser Gly Asp val Val Arg Phe Pro Asn lie Thr 
305 310 315 320 

Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser 
325 330 335 

Val Tyr Ala Trp Glu Arg Lys Lys lie Ser Asn Cys val Ala Asp Tyr 
340 345 350 

Ser Val Leu Tyr Asn ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly 
355 360 365 

Val ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala 
370 375 380 

Asp Ser Phe val Val Lys Gly Asp Asp Val Arg Gin lie Ala Pro Gly 
385 390 395 400 

Gin Thr Gly Val lie Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 
405 410 415 

Met Gly Cys val Leu Ala Trp Asn Thr Arg Asn lie Asp Ala Thr ser 
420 425 ~ 430 

Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu 
435 440 445 

Arg Pro Phe Glu Arg Asp lie ser Asn Val Pro Phe ser Pro Asp Gly 
450 455 460 

Lys pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp 
465 470 475 480 

Tyr Gly Phe Tyr Thr Thr Thr Gly lie Gly Tyr Gin Pro Tyr Arg Val 
485 490 495 

Val val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val cys Gly 
500 505 510 
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pro Lys Leu ser Thr Asp Leu lie Lys Asn Gin cys val Asn Phe Asn 
515 520 525 

Phe Asn Gly Leu Thr Gly Thr Gly val Leu Thr Pro ser ser Lys Arg 
530 535 540 

Phe Gin Pro Phe Gin Gin Phe Gly Arg Asp Val Ser Asp Phe Thr Asp 
545 550 555 560 

Ser Val Arg Asp Pro Lys Thr Ser Glu lie Leu Asp lie ser Pro Cys 
565 570 575 

Ser Phe Gly Gly Val Ser Val lie Thr Pro Gly Thr Asn Ala Ser Ser 
580 585 590 

Glu Val Ala val Leu Tyr Gin Asp Val Asn cys Thr Asp Val Ser Thr 
595 * 600 605 

Ala lie His Ala Asp Gin Leu Thr Pro Ala Trp Arg lie Tyr Ser Thr 
610 615 620 

Gly Asn Asn val Phe Gin Thr Gin Ala Gly cys Leu lie Gly Ala Glu 
625 630 635 640 

His Val Asp Thr ser Tyr Glu Cys Asp lie Pro lie Gly Ala Gly lie 
645 650 655 

Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gin Lys 
660 665 670 

ser lie val Ala Tyr Thr Met ser Leu Gly Ala Asp Ser ser lie Ala 
675 680 685 

Tyr Ser Asn Asn Thr lie Ala lie Pro Thr Asn Phe Ser lie ser lie 
690 695 700 

Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp cys 
705 710 715 720 

Asn Met Tyr He Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu 
725 730 735 

Gin Tyr Gly ser Phe cys Thr Gin Leu Asn Arg Ala Leu Ser Gly lie 
740 745 750 

Ala Ala Glu Gin Asp Arg Asn Thr Arg Glu val Phe Ala Gin val Lys 
755 ~ 760 " 765 

Gin Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly phe Asn Phe 
770 775 780 
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Ser Gin lie Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe lie 
785 790 795 800 

Glu Asp Leu Leu Phe Asn Lys val Thr Leu Ala Asp Ala Gly Phe Met 
805 810 815 

Lys Gin Tyr Gly Glu Cys Leu Gly Asp lie Asn Ala Arg Asp Leu lie 
y 820 825 830 

cys Ala Gin Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr 
y 835 840 845 

Asp Asp Met He Ala Ala Tyr Thr Ala Ala Leu val ser Gly Thr Ala 
850 855 860 

Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gin lie Pro Phe 
865 870 875 880 

Ala Met Gin Met Ala Tyr Arg Phe Asn Gly lie Gly Val Thr Gin Asn 
885 890 895 

Val Leu Tyr Glu Asn Gin Lys Gin lie Ala Asn Gin Phe Asn Lys Ala 
900 905 910 

lie ser Gin lie Gin Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly 
915 920 925 

Lys Leu Gin Asp Val Val Asn Gin Asn Ala Gin Ala Leu Asn Thr Leu 
930 935 940 

val Lys Gin Leu Ser ser Asn Phe Gly Ala lie Ser ser Val Leu Asn 
945 950 955 960 

Asp lie Leu ser Arg Leu Asp Lys Val Glu Ala Glu Val Gin lie Asp 
965 970 975 

Arg Leu lie Thr Gly Arg Leu Gin Ser Leu Gin Thr Tyr val Thr Gin 
980 985 990 

Gin Leu lie Arg Ala Ala Glu lie Arg Ala ser Ala Asn Leu Ala Ala 
995 1000 1005 

Thr Lys Met ser Glu cys Val Leu Gly Gin ser Lys Arg Val Asp 
1010 1015 1020 

Phe cys Gly Lys Gly Tyr His Leu Met ser Phe Pro Gin Ala Ala 
1025 1030 1035 

pro His Gly val val Phe Leu His Val Thr Tyr val Pro ser Gin 
1040 1045 1050 

page 25 



WO 2005/056584 PCT/FR2004/003106 

S226CAS108.ST25 

Glu Arg Asn Phe Thr Thr Ala Pro Ala lie Cys His Glu Gly Lys 
1055 1060 1065 

Ala Tyr Phe Pro Arg Glu Gly Val Phe val Phe Asn Gly Thr ser 
1070 1075 1080 

Trp Phe lie Thr Gin Arg Asn Phe Phe ser Pro Gin lie lie Thr 
1085 1090 1095 

Thr Asp Asn Thr Phe val Ser Gly Asn Cys Asp val Val lie Gly 
1100 1105 1110 

lie lie Asn Asn Thr val Tyr Asp Pro Leu Gin Pro Glu Leu Asp 
1115 1120 1125 

ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr ser 
1130 1135 1140 

Pro Asp val Asp Leu Gly Asp lie Ser Gly lie Asn Ala Ser Val 
1145 1150 1155 

Val Asn lie Gin Lys Glu lie Asp Arg Leu Asn Glu val Ala Lys 
1160 1165 ~ 1170 

Asn Leu Asn Glu Ser Leu lie Asp Leu Gin Glu Leu Gly Lys Tyr 
1175 1180 1185 

Glu Gin Tyr lie Lys Trp Pro Trp Tyr val Trp Leu Gly Phe lie 
1190 1195 1200 

Ala Gly Leu lie Ala lie Val Met Val Thr lie Leu Leu Cys Cys 
1205 1210 1215 

Met Thr ser Cys Cys ser Cys Leu Lys Gly Ala Cys ser cys Gly 
1220 1225 1230 

Ser cys cys Lys Phe Asp Glu Asp Asp ser Glu Pro Val Leu Lys 
1235 1240 1245 

Gly val Lys Leu His Tyr Thr 
1250 1255 

<210> 4 

<211> 3943 

<212> DNA 

<213> CORONAVIRUS 



<400> 4 

ctcttctgga aaaaggtagg cttatcatta gagaaaacaa cagagttgtg gtttcaagtg 60 
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atattcttgt 


taacaactaa 


acgaacatgt 


ttattttctt 


attatttctt 


actctcacta 


120 


gtggtagtga 


ccttgaccgg 


tgcaccactt 


ttgatgatgt 


tcaagctcct 


aattacactc 


180 


aacatacttc 


atctatgagg 


ggggtttact 


atcctgatga 


aatttttaga 


tcagacactc 


240 


tttatttaac 


tcaggattta 


tttcttccat 


tttattctaa 


tgttacaggg 


tttcatacta 


300 


ttaatcatac 


gtttggcaac 


cctgtcatac 


cttttaagga 


tggtatttat 


tttgctgcca 


360 


cagagaaatc 


aaatgttgtc 


cgtggttggg 


tttttggttc 


taccatgaac 


aacaagtcac 


420 


agtcggtgat 


tattattaac 


aattctacta 


atgttgttat 


acgagcatgt 


aactttgaat 


480 


tgtgtgacaa 


ccctttcttt 


gctgtttcta 


aacccatggg 


tacacagaca 


catactatga 


540 


tattcgataa 


tgcatttaat 


tgcactttcg 


agtacatatc 


tgatgccttt 


tcgcttgatg 


600 


tttcagaaaa 


gtcaggtaat 


tttaaacact 


tacgagagtt 


tgtgtttaaa 


aataaagatg 


660 


ggtttctcta 


tgtttataag 


ggctatcaac 


ctatagatgt 


agttcgtgat 


ctaccttctg 


720 


gttttaacac 


tttgaaacct 


atttttaagt 


tgcctcttgg 


tattaacatt 


acaaatttta 


780 


gagccattct 


tacagccttt 


tcacctgctc 


aagacatttg 


gggcacgtca 


gctgcagcct 


840 


attttgttgg 


ctatttaaag 


ccaactacat 


ttatgctcaa 


gtatgatgaa 


aatggtacaa 


900 


tcacagatgc 


tgttgattgt 


tctcaaaatc 


cacttgctga 


actcaaatgc 


tctgttaaga 


960 


gctttgagat 


tgacaaagga 


atttaccaga 


cctctaattt 


cagggttgtt 


ccctcaggag 


1020 


atgttgtgag 


attccctaat 


attacaaact 


tgtgtccttt 


tggagaggtt 


tttaatgcta 


1080 


ctaaattccc 


ttctgtctat 


gcatgggaga 


gaaaaaaaat 


ttctaattgt 


gttgctgatt 


1140 


actctgtgct 


ctacaactca 


acattttttt 


caacctttaa 


gtgctatggc 


gtttctgcca 


1200 


ctaagttgaa 


tgatctttgc 


ttctccaatg 


tctatgcaga 


ttcttttgta 


gtcaagggag 


1260 


atgatgtaag 


acaaatagcg 


ccaggacaaa 


ctggtgttat 


tgctgattat 


aattataaat 


1320 


tgccagatga 


tttcatgggt 


tgtgtccttg 


cttggaatac 


taggaacatt 


gatgctactt 


1380 


caactggtaa 


ttataattat 


aaatataggt 


atcttagaca 


tggcaagctt 


aggccctttg 


1440 


agagagacat 


atctaatgtg 


cctttctccc 


ctgatggcaa 


accttgcacc 


ccacctgctc 


1500 


ttaattgtta 


ttggccatta 


aatgattatg 


gtttttacac 


cactactggc 


attggctacc 


1560 


aaccttacag 


agttgtagta 


ctttcttttg 


aacttttaaa 


tgcaccggcc 


acggtttgtg 


1620 


gaccaaaatt 


atccactgac 


cttattaaga 


accagtgtgt 


caattttaat 


tttaatggac 


1680 


tcactggtac 


tggtgtgtta 


actccttctt 


caaagagatt 


tcaaccattt 


caacaatttg 


1740 


gccgtgatgt 


ctctgatttc 


actgattccg 


ttcgagatcc 


taaaacatct 


gaaatattag 


1800 


acatttcacc 


ttgctctttt 


gggggtgtaa 


gtgtaattac 


acctggaaca 


aatgcttcat 


1860 


ctgaagttgc 


tgttctatat 


caagatgtta 


actgcactga 


tgtttctaca 


gcaatccatg 


1920 


cagatcaact 


cacaccagct 


tggcgcatat 


attctactgg 


aaacaatgta 


ttccagactc 


1980 


aagcaggctg 


tcttatagga 


gctgagcatg 


tcgacacttc 


ttatgagtgc 


gacattccta 


2040 


ttggagctgg 


catttgtgct 


agttaceata 


cagtttcttt 
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aatctattgt 


ggcttatact 


atgtctttag 


gtgctgatag 


ttcaattgct 


tactctaata 


2160 


acaccattgc 


tatacctact 


aacttttcaa 


ttagcattac 


tacagaagta 


atgcctgttt 


2220 


ctatggctaa 


aacctccgta 


gattgtaata 


tgtacatctg 


cggagattct 


actgaatgtg 


2280 


ctaatttgct 


tctccaatat 


ggtagctttt 


gcacacaact 


aaatcgtgca 


ctctcaggta 


2340 


ttgctgctga 


acaggatcgc 


aacacacgtg 


aagtgttcgc 


tcaagtcaaa 


caaatgtaca 


2400 


aaaccccaac 


tttgaaatat 


tttggtggtt 


ttaatttttc 


acaaatatta 


cctgaccctc 


2460 


taaagccaac 


taagaggtct 


tttattgagg 


acttgctctt 


taataaggtg 


acactcgctg 


2520 


atgctggctt 


catgaagcaa 


tatggcgaat 


gcctaggtga 


tattaatgct 


agagatctca 


2580 


tttgtgcgca 


gaagttcaat 


gggcttacag 


tgttgccacc 


tctgctcact 


gatgatatga 


2640 


ttgctgccta 


cactgctgct 


ctagttagtg 


gtactgccac 


tgctggatgg 


acatttggtg 


2700 


ctggcgctgc 


tcttcaaata 


ccttttgcta 


tgcaaatggc 


atataggttc 


aatggcattg 


2760 


gagttaccca 


aaatgttctc 


tatgagaacc 


aaaaacaaat 


cgccaaccaa 


tttaacaagg 


2820 


cgattagtca 


aattcaagaa 


tcacttacaa 


caacatcaac 


tgcattgggc 


aagctgcaag 


2880 


acgttgttaa 


ccagaatgct 


caagcattaa 


acacacttgt 


taaacaactt 


agctctaatt 


2940 


ttggtgcaat 


ttcaagtgtg 


ctaaatgata 


tcctttcgcg 


acttgataaa gtcgaggcgg 


3000 


aggtacaaat 


tgacaggcta 


attacaggca 


gacttcaaag 


ccttcaaacc 


tatgtaacac 


3060 


aacaactaat 


cagggctgct 


gaaatcaggg 


cttctgctaa 


tcttgctgct 


actaaaatgt 


3120 


ctgagtgtgt 


tcttggacaa 


tcaaaaagag 


ttgacttttg 


tggaaagggc 


taccacctta 


3180 


tgtccttccc 


acaagcagcc 


ccgcatggtg 


ttgtcttcct 


acatgtcacg 


tatgtgccat 


3240 


cccaggagag 


gaacttcacc 


acagcgccag 


caatttgtca 


tgaaggcaaa 


gcatacttcc 


3300 


ctcgtgaagg 


tgtttttgtg 


tttaatggca 


cttcttggtt 


tattacacag 


aggaacttct 


3360 


tttctccaca 


aataattact 


acagacaata 


catttgtctc 


aggaaattgt 


gatgtcgtta 


3420 


ttggcatcat 


taacaacaca 


gtttatgatc 


ctctgcaacc 


tgagcttgac 


tcattcaaag 


3480 


aagagctgga 


caagtacttc 


aaaaatcata 


catcaccaga 


tgttgatctt 


ggcgacattt 


3540 


caggcattaa 


cgcttctgtc 


gtcaacattc 


aaaaagaaat 


tgaccgcctc 


aatgaggtcg 


3600 


ctaaaaattt 


aaatgaatca 


ctcattgacc 


ttcaagaatt 


gggaaaatat 


gagcaatata 


3660 


ttaaatggcc 


ttggtatgtt 


tggctcggct 


tcattgctgg 


actaattgcc 


atcgtcatgg 


3720 


ttacaatctt 


gctttgttgc 


atgactagtt 


gttgcagttg 


cctcaagggt 


gcatgctctt 


3780 


gtggttcttg 


ctgcaagttt 


gatgaggatg 


actctgagcc 


agttctcaag 


ggtgtcaaat 


3840 


tacattacac 


ataaacgaac 


ttatggattt 


gtttatgaga 


ttttttactc 


ttggatcaat 


3900 


tactgcacag 


ccagtaaaaa 


ttgacaatgc 


ttctcctgca 


agt 




3943 



<210> 5 
<211> 2049 
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<212> DNA 

<213> CORONAVIRUS 



<400> 5 
ctcttctgga 


aaaaggtagg 


cttatcatta 


gagaaaacaa 


cagagttgtg 


gtttcaagtg 


60 


atattcttgt 


taacaactaa 


acgaacatgt 


ttattttctt 


attatttctt 


actctcacta 


120 


gtggtagtga 


ccttgaccgg 


tgcaccactt ttgatgatgt 


tcaagctcct 


aattacactc 


180 


aacatacttc 


atctatgagg 


ggggtttact 


atcctgatga 


aatttttaga 


tcagacactc 


240 


tttatttaac 


tcaggattta 


tttcttccat 


tttattctaa 


tgttacaggg 


tttcatacta 


300 


ttaatcatac 


gtttggcaac 


cctgtcatac 


cttttaagga 


tggtatttat 


tttgctgcca 


360 


cagagaaatc 


aaatgttgtc 


cgtggttggg 


tttttggttc 


taccatgaac 


aacaagtcac 


420 


agtcggtgat 


tattattaac 


aattctacta atgttgttat 


acgagcatgt 


aactttgaat 


480 


tgtgtgacaa 


ccctttcttt 


gctgtttcta 


aacccatggg 


tacacagaca 


catactatga 


540 


tattcgataa 


tgcatttaat 


tgcactttcg 


agtacatatc 


tgatgccttt 


tcgcttgatg 


600 


tttcagaaaa 


gtcaggtaat 


tttaaacact 


tacgagagtt 


tgtgtttaaa 


aataaagatg 


660 


ggtttctcta 


tgtttataag 


ggctatcaac 


ctatagatgt 


agttcgtgat 


ctaccttctg 


720 


gttttaacac 


tttgaaacct 


attttxaagt 


tgcctcttgg 


tattaacatt 


acaaatttta 


780 


gagccattct 


tacagccttt 


tcacctgctc 


aagacatttg 


gggcacgtca 


gctgcagcct 


840 


attttgttgg 


ctatttaaag 


ccaactacat 


tuatgctcaa 


gtatgatgaa 


aatggtacaa 


900 


tcacagatgc 


tgttgattgt 


tctcaaaatc 


cacttgctga 


actcaaatgc 


tctgttaaga 


960 


gctttgagat 


tgacaaagga 


atttaccaga 


cctctaattt 


cagggttgtt 


ccctcaggag 


1020 


atgttgtgag 


attccctaat 


attacaaact 


tgtgtccttt 


tggagaggtt 


tttaatgcta 


1080 


ctaaattccc 


ttctgtctat 


gcatgggaga 


gaaaaaaaat 


ttctaattgt 


gttgctgatt 


1140 


actctgtgct 


ctacaactca 


acattttttt 


caacctttaa 


gtgctatggc 


gtttctgcca 


1200 


ctaagttgaa 


tgatctttgc 


ttctccaatg 


tctatgcaga 


ttcttttgta 


gtcaagggag 


1260 


atgatgtaag 


acaaatagcg 


ccaggacaaa 


ctggtgttat 


tgctgattat 


aattataaat 


1320 


tgccagatga 


tttcatgggt 


tgtgtccttg 


cttggaatac 


taggaacatt 


gatgctactt 


1380 


caactggtaa 


ttataattat 


aaatataggt 


atcttagaca 


tggcaagctt 


aggccctttg 


1440 


agagagacat 


atctaatgtg 


cctttctccc 


ctgatggcaa 


accttgcacc 


ccacctgctc 


1500 


ttaattgtta 


ttggccatta 


aatgattatg 


gtttttacac 


cactactggc 


attggctacc 


1560 


aaccttacag 


agttgtagta 


ctttcttttg 


aacttttaaa 


tgcaccggcc 


acggtttgtg 


1620 


gaccaaaatt 


atccactgac 


cttattaaga 


accagtgtgt 


caattttaat 


tttaatggac 


1680 


tcactggtac 


tggtgtgtta 


actccttctt 


caaagagatt 


tcaaccattt 


caacaatttg 


1740 


gccgtgatgt 


ctctgatttc 


actgattccg 


ttcgagatcc 


taaaacatct 


gaaatattag 


1800 


acatttcacc 


ttgctctttt 


gggggtgtaa gtgtaattac 
Page 29 


acctggaaca 


aatgcttcat 


1860 



WO 2005/056584 



PCTYFR2004/003106 



S226CAS108.ST25 

ctgaagttgc tgttctatat caagatgtta actgcactga tgtttctaca gcaatccatg 1920 

cagatcaact cacaccagct tggcgcatat attctactgg aaacaatgta ttccagactc 1980 

aagcaggctg tcttatagga gctgagcatg tcgacacttc ttatgagtgc gacattccta 2040 

ttggagctg 2049 

<210> 6 

<211> 2027 

<212> DNA 

<213> CORONAVIRUS 



<400> 6 
catgcagatc 


aactcacacc 


agcttggcgc 


atatattcta 


ctggaaacaa tgtattccag 


60 


actcaagcag 


gctgtcttat 


aggagctgag 


catgtcgaca 


cttcttatga gtgcgacatt 


120 


cctattggag 


ctggcatttg 


tgctagttac 


catacagttt 


ctttattacg 


tagtactagc 


180 


caaaaatcta 


ttgtggctta 


tactatgtct 


ttaggtgctg 


atagttcaat 


tgcttactct 


240 


aataacacca 


ttgctatacc 


tactaacttt 


tcaattagca ttactacaga 


agtaatgcct 


300 


gtttctatgg 


ctaaaacctc 


cgtagattgt 


aatatgtaca 


tctgcggaga 


ttctactgaa 


360 


tgtgctaatt 


tgcttctcca 


atatggtagc 


ttttgcacac 


aactaaatcg 


tgcactctca 


420 


ggtattgctg 


ctgaacagga 


tcgcaacaca 


cgtgaagtgt 


tcgctcaagt 


caaacaaatg 


480 


tacaaaaccc 


caactttgaa 


atattttggt 


ggttttaatt 


tttcacaaat 


attacctgac 


540 


cctctaaagc 


caactaagag 


gtcttttatt 


gaggacttgc 


tctttaataa 


ggtgacactc 


600 


gctgatgctg 


gcttcatgaa 


gcaatatggc 


gaatgcctag 


gtgatattaa 


tgctagagat 


660 


ctcatttgtg 


cgcagaagtt 


caatgggctt 


acagtgttgc 


cacctctgct 


cactgatgat 


720 


atgattgctg 


cctacactgc 


tgctctagtt 


agtggtactg 


ccactgctgg 


atggacattt 


780 


ggtgctggcg 


ctgctcttca 


aatacctttt 


gctatgcaaa 


tggcatatag 


gttcaatggc 


840 


attggagtta 


cccaaaatgt 


tctctatgag 


aaccaaaaac 


aaatcgccaa 


ccaatttaac 


900 


aaggcgatta 


gtcaaattca 


agaatcactt 


acaacaacat 


caactgcatt 


gggcaagctg 


960 


caagacgttg 


ttaaccagaa 


tgctcaagca 


ttaaacacac 


ttgttaaaca 


acttagctct 


1020 


aattttggtg 


caatttcaag 


tgtgctaaat 


gatatccttt 


cgcgacttga 


taaagtcgag 


1080 


gcggaggtac 


aaattgacag 


gttaattaca 


ggcagacttc 


aaagccttca 


aacctatgta 


1140 


acacaacaac 


taatcagggc 


tgctgaaatc 


agggcttctg 


ctaatcttgc tgctactaaa 


1200 


atgtctgagt 


gtgttcttgg 


acaatcaaaa 


agagttgact 


tttgtggaaa gggctaccac 


1260 


cttatgtcct 


tcccacaagc 


agccccgcat 


ggtgttgtct 


tcctacatgt 


cacgtatgtg 


1320 


ccatcccagg 


agaggaactt 


caccacagcg 


ccagcaattt 


gtcatgaagg 


caaagcatac 


1380 


ttccctcgtg 


aaggtgtttt 


tgtgtttaat 


ggcacttctt 


ggtttattac 


acagaggaac 


1440 
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ttcttttctc cacaaataat tactacagac aatacatttg tctcaggaaa ttgtgatgtc 1500 

gttattggcg tcattaacaa cacagtttat gatcctctgc aacctgagct tgactcattc 1560 

aaagaagagc tggacaagta cttcaaaaat catacatcac cagatgttga tcttggcgac 1620 

atttcaggca ttaacgcttc tgtcgtcaac attcaaaaag aaattgaccg cctcaatgag 1680 

gtcgctaaaa atttaaatga atcactcatt gaccttcaag aattgggaaa atatgagcaa 1740 

tatattaaat ggccttggta tgtttggctc ggcttcattg ctggactaat tgccatcgtc 1800 

atggttacaa tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc 1860 

tcttgtggtt cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc 1920 

aaattacatt acacataaac gaacttatgg atttgtttat gagatttttt actcttggat 1980 

caattactgc acagccagta aaaattgaca atgcttctcc tgcaagt 2027 

<210> 7 

<211> 1096 

<212> DNA 

<213> CORONAVIRUS 

<400> 7 

tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 60 

cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattacatt 120 

acacataaac gaacttatgg atttgtttat gagatttttt actcttggat caattactgc 180 

acagccagta aaaattgaca atgcttctcc tgcaagtact gttcatgcta cagcaacgat 240 

accgctacaa gcctcactcc ctttcggatg gcttgttatt ggcgttgcat ttcttgctgt 300 

ttttcagagc gctaccaaaa taattgcgct caataaaaga tggcagctag ccctttataa 360 

gggcttccag ttcatttgca atttactgct gctatttgtt accatctatt cacatctttt 420 

gcttgtcgct gcaggtatgg aggcgcaatt tttgtacctc tatgccttga tatattttct 480 

acaatgcatc aacgcatgta gaattattat gagatgttgg ctttgttgga agtgcaaatc 540 

caagaaccca ttactttatg atgccaacta ctttgtttgc tggcacacac ataactatga 600 

ctactgtata ccatataaca gtgtcacaga tacaattgtc gttactgaag gtgacggcat 660 

ttcaacacca aaactcaaag aagactacca aattggtggt tattctgagg ataggcactc 720 

aggtgttaaa gactatgtcg ttgtacatgg ctatttcacc gaagtttact accagcttga 780 

gtctacacaa attactacag acactggtat tgaaaatgct acattcttca tctttaacaa 840 

gcttgttaaa gacccaccga atgtgcaaat acacacaatc gacggctctt caggagttgc 900 

taatccagca atggatccaa tttatgatga gccgacgacg actactagcg tgcctttgta 960 

agcacaagaa agtgagtacg aacttatgta ctcattcgtt tcggaagaaa caggtacgtt 1020 

aatagttaat agcgtacttc tttttcttgc tttcgtggta ttcttgctag tcacactagc 1080 
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catccttact gcgctt 1096 

<210> 8 

<211> 1135 

<212> DNA 

<213> CORONAVIRUS 



<400> 8 
attgccatcg 


tcatggttac 


aatcttgctt 


tgttgcatga 


ctagttgttg 


cagttgcctc 


60 


aagggtgcat 


gctcttgtgg 


ttcttgctgc 


aagtttgatg 


aggatgactc 


tgagccagtt 


120 


ctcaagggtg 


tcaaattaca 


ttacacataa 


acgaacttat 


ggatttgttt 


atgagatttt 


180 


ttactcttgg 


atcaattact 


gcacagccag 


taaaaattga 


caatgcttct 


cctgcaagta 


240 


ctgttcatgc 


tacagcaacg 


ataccgctac 


aagcctcact 


ccctttcgga 


tggcttgtta 


300 


ttggcgttgc 


atttcttgct 


gtttttcaga gcgctaccaa aataattgcg 


ctcaataaaa 


360 


gatggcagct 


agccctttat 


aagggcttcc 


agttcatttg 


caatttactg 


ctgctatttg 


420 


ttaccatcta 


ttcacatctt 


ttgcttgtcg 


ctgcaggtat 


ggaggcgcaa 


tttttgtacc 


480 


tctatgcctt 


gatatatttt 


ctacaatgca tcaacgcatg 


tagaattatt 


atgagatgtt 


540 


ggctttgttg 


gaagtgcaaa 


tccaagaacc 


cattacttta 


tgatgccaac 


tactttgttt 


600 


gctggcacac 


acataactat 


gactactgta 


taccatataa 


cagtgtcaca 


gatacaattg 


660 


tcgttactga 


aggtgacggc 


atttcaacac 


caaaactcaa 


agaagactac 


caaattggtg 


720 


gttattctga 


ggataggcac 


tcaggtgtta 


aagactatgt 


cgttgtacat 


ggctatttca 


780 


ccgaagttta 


ctaccagctt 


gagtctacac 


aaattactac 


agacactggt 


attgaaaatg 


840 


ctacattctt 


catctttaac 


aagcttgtta 


aagacccacc 


gaatgtgcaa 


atacacacaa 


900 


tcgacggctc 


ttcaggagtt 


gctaatccag 


caatggatcc 


aatttatgat 


gagccgacga 


960 


cgactactag 


cgtgcctttg 


taagcacaag 


aaagtgagta 


cgaacttatg 


tactcattcg 


1020 


tttcggaaga 


aacaggtacg 


ttaatagtta 


atagcgtact 


tctttttctt 


gctttcgtgg 


1080 


tattcttgct 


agtcacacta 


gccatcctta 


ctgcgcttcg 


attgtgtgcg 


tactg 


1135 



<210> 9 

<211> 1096 

<212> DNA 

<213> CORONAVIRUS 



<220> 

<221> CDS 
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<222> C137) . . (958) 

<223> 
<400> 9 

tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 60 
cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattacatt 120 



aaa ata att gcg etc aat aaa aga tgg cag eta gec ctt tat aag ggc 
Lys lie lie Ala Leu Asn Lys Arg Trp Gin Leu Ala Leu Tyr Lys Gly 
65 70 75 



172 



acacataaac gaactt atg gat ttg ttt atg aga ttt ttt act ctt gga tea 

Met Asp Leu Phe Met Arg Phe Phe Thr Leu Gly ser 
1 5 10 

att act gca cag cca gta aaa att gac aat get tct cct gca agt act 220 
lie Thr Ala Gin Pro Val Lys He Asp Asn Ala Ser Pro Ala ser Thr 
15 20 25 

gtt cat get aca gca acg ata ccg eta caa gec tea etc cct ttc gga 268 
Val His Ala Thr Ala Thr lie Pro Leu Gin Ala ser Leu Pro Phe Gly 
30 35 40 

tgg ctt gtt att ggc gtt gca ttt ctt get gtt ttt cag age get ace 316 
Trp Leu val lie Gly Val Ala Phe Leu Ala val Phe Gin Ser Ala Thr 
45 50 55 60 



364 



ttc cag ttc att tgc aat tta ctg ctg eta ttt gtt ace ate tat tea 412 
Phe Gin Phe lie cys Asn Leu Leu Leu Leu Phe Val Thr lie Tyr ser 
80 85 90 

cat ctt ttg ctt gtc get gca ggt atg gag gcg caa ttt ttg tac etc 460 
His Leu Leu Leu val Ala Ala Gly Met Glu Ala Gin Phe Leu Tyr Leu 
95 100 105 

tat gec ttg ata tat ttt eta caa tgc ate aac gca tgt aga att att 508 
Tyr Ala Leu lie Tyr Phe Leu Gin Cys lie Asn Ala Cys Arg lie lie 
110 115 120 

atg aga tgt tgg ctt tgt tgg aag tgc aaa tec aag aac cca tta ctt 556 
Met Arg cys Trp Leu cys Trp Lys cys Lys ser Lys Asn Pro Leu Leu 
125 130 135 140 

tat gat gec aac tac ttt gtt tgc tgg cac aca cat aac tat gac tac 604 
Tyr Asp Ala Asn Tyr Phe val cys Trp His Thr His Asn Tyr Asp Tyr 
145 150 155 

tgt ata cca tat aac agt gtc aca gat aca att gtc gtt act gaa ggt 652 
Cys He pro Tyr Asn Ser Val Thr Asp Thr lie Val Val Thr Glu Gly 
160 165 170 

gac ggc att tea aca cca aaa etc aaa gaa gac tac caa att ggt ggt 700 
Asp Gly lie ser Thr Pro Lys Leu Lys Glu Asp Tyr Gin lie Gly Gly 
175 180 185 

tat tct gag gat agg cac tea ggt gtt aaa gac tat gtc gtt gta cat 748 
Tyr Ser Glu Asp Arg His ser Gly Val Lys Asp Tyr Val val val His 
190 195 200 

ggc tat ttc ace gaa gtt tac tac cag ctt gag tct aca caa att act 796 
Gly Tyr Phe Thr Glu Val Tyr Tyr Gin Leu Glu Ser Thr Gin lie Thr 
205 210 215 220 

aca gac act ggt att gaa aat get aca ttc ttc ate ttt aac aag ctt 844 
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Thr Asp Thr Gly He Glu Asn Ala Thr Phe phe He Phe Asn Lys Leu 
225 230 235 

gtt aaa gac cca ccg aat gtg caa ata cac aca ate gac ggc tct tea 
Val Lys Asp Pro Pro Asn Val Gin lie His Thr lie Asp Gly Ser Ser 



240 



245 



250 



gga gtt get aat cca gca atg gat cca att tat gat gag ccg acg acg 
Gly val Ala Asn Pro Ala Met Asp Pro lie Tyr Asp Glu Pro Thr Thr 
255 260 265 

act act age gtg cct ttg taagcacaag aaagtgagta cgaacttatg 
Thr Thr ser Val Pro Leu 
270 

tactcattcg ttteggaaga aacaggtacg ttaatagtta atagegtact tctttttctt 
gctttcgtgg tattcttget agtcacacta gccatcctta ctgegett 



892 

940 

988 

1048 
1096 



<210> 


10 


<211> 


274 


<212> 


PRT 


<213> 


CORONAVIRUS 


<400> 


10 



Met Asp Leu Phe Met Arg Phe Phe Thr Leu Gly Ser lie Thr Ala Gin 
1 5 10 15 

Pro Val Lys lie Asp Asn Ala Ser Pro Ala Ser Thr Val His Ala Thr 
20 25 30 

Ala Thr lie Pro Leu Gin Ala ser Leu Pro Phe Gly Trp Leu val lie 
35 40 45 

Gly val Ala Phe Leu Ala Val Phe Gin ser Ala Thr Lys lie lie Ala 
50 55 60 

Leu Asn Lys Arg Trp Gin Leu Ala Leu Tyr Lys Gly Phe Gin Phe lie 
65 70 75 80 

cys Asn Leu Leu Leu Leu Phe val Thr lie Tyr ser His Leu Leu Leu 
85 90 95 

Val Ala Ala Gly Met Glu Ala Gin Phe Leu Tyr Leu Tyr Ala Leu lie 
100 105 110 

Tyr Phe Leu Gin Cys lie Asn Ala Cys Arg lie lie Met Arg Cys Trp 
115 120 125 



Leu cys Trp Lys cys Lys ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn 
130 135 140 
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Tyr Phe Val cys Trp Hns Thr His Asn Tyr Asp Tyr Cys He Pro Tyr 
145 150 155 160 

Asn Ser val Thr Asp Thr lie Val Val Thr Glu Gly Asp Gly lie ser 
165 170 175 

Thr Pro Lys Leu Lys Glu Asp Tyr Gin lie Gly Gly Tyr ser Glu Asp 
180 185 190 

Arg His Ser Gly Val Lys Asp Tyr val Val Val His Gly Tyr Phe Thr 
195 200 205 

Glu val Tyr Tyr Gin Leu Glu ser Thr Gin lie Thr Thr Asp Thr Gly 
210 215 220 

lie Glu Asn Ala Thr Phe phe lie Phe Asn Lys Leu Val Lys Asp Pro 
225 230 235 240 

Pro Asn Val Gin lie His Thr lie Asp Gly Ser ser Gly val Ala Asn 
245 250 255 

Pro Ala Met Asp Pro lie Tyr Asp Glu Pro Thr Thr Thr Thr ser Val 
260 265 270 

Pro Leu 

<210> 11 

<211> 1096 

<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 

<222> (558).. (1019) 
<223> 

<400> 11 

tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 60 

cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattacatt 120 

acacataaac gaacttatgg atttgtttat gagatttttt actcttggat caattactgc 180 

acagccagta aaaattgaca atgcttctcc tgcaagtact gttcatgcta cagcaacgat 240 

accgctacaa gcctcactcc ctttcggatg gcttgttatt ggcgttgcat ttcttgctgt 300 

ttttcagagc gctaccaaaa taattgcgct caataaaaga tggcagctag ccctttataa 360 
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gggcttccag ttcatttgca atttactgct gctatttgtt accatctatt cacatctttt 

gcttgtcgct gcaggtatgg aggcgcaatt tttgtacctc tatgccttga tatattttct 

acaatgcatc aacgcatgta gaattattat gagatgttgg ctttgttgga agtgcaaatc 

caagaaccca ttacttt atg atg cca act act ttg ttt get ggc aca cac 

Met Met Pro Thr Thr Leu Phe Ala Gly Thr His 
1 5 10 

ata act atg act act gta tac cat ata aca gtg tea cag ata caa ttg 
He Thr Met Thr Thr val Tyr His He Thr Val Ser Gin lie Gin Leu 
15 20 25 

teg tta ctg aag gtg acg gca ttt caa cac caa aac tea aag aag act 
Ser Leu Leu Lys Val Thr Ala Phe Gin His Gin Asn Ser Lys Lys Thr 



30 



35 



40 



ace aaa ttg gtg gtt att ctg agg ata ggc act cag gtg tta aag act 
Thr Lys Leu Val Val He Leu Arg lie Gly Thr Gin Val Leu Lys Thr 
45 50 55 

atg teg ttg tac atg get att tea ccg aag ttt act acc age ttg agt 
Met Ser Leu Tyr Met Ala lie ser Pro Lys Phe Thr Thr ser Leu ser 
60 65 70 75 

eta cac aaa tta eta cag aca ctg gta ttg aaa atg eta cat tct tea 
Leu His Lys Leu Leu Gin Thr Leu Val Leu Lys Met Leu His ser ser 
80 85 90 

tct tta aca age ttg tta aag acc cac cga atg tgc aaa tac aca caa 
ser Leu Thr Ser Leu Leu Lys Thr His Arg Met cys Lys Tyr Thr Gin 
95 100 105 

teg acg get ctt cag gag ttg eta ate cag caa tgg ate caa ttt atg 
Ser Thr Ala Leu Gin Glu Leu Leu lie Gin Gin Trp lie Gin Phe Met 
110 115 120 

atg age cga cga cga eta eta gcg tgc ctt tgt aag cac aag aaa gtg 
Met ser Arg Arg Arg Leu Leu Ala cys Leu Cys Lys His Lys Lys val 
125 130 135 

agt acg aac tta tgt act cat teg ttt egg aag aaa cag gta cgt 
ser Thr Asn Leu cys Thr His Ser Phe Arg Lys Lys Gin Val Arg 
140 145 150 

taatagttaa tagegtaett ctttttcttg ctttcgtggt attcttgeta gtcacactag 
ccatccttac tgegett 



420 
480 
540 
590 

638 

686 

734 

782 

830 

878 

926 

974 

1019 

1079 
1096 



<210> 12 

<211> 154 

<212> PRT 

<213> CORONAVIRUS 

<400> 12 

Met Met Pro Thr Thr Leu Phe Ala Gly Thr His lie Thr Met Thr Thr 
15 10 15 
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val Tyr His He Thr Val Ser Gin He Gin Leu Ser Leu Leu Lys val 
20 25 30 

Thr Ala Phe Gin His Gin Asn ser Lys Lys Thr Thr Lys Leu val Val 
35 40 45 

lie Leu Arg lie. Gly Thr Gin Val Leu Lys Thr Met Ser Leu Tyr Met 
50 55 60 

Ala lie Ser Pro Lys Phe Thr Thr Ser Leu Ser Leu His Lys Leu Leu 
65 70 75 80 

Gin Thr Leu val Leu Lys Met Leu His ser ser ser Leu Thr Ser Leu 
85 90 95 

Leu Lys Thr His Arg Met cys Lys Tyr Thr Gin ser Thr Ala Leu Gin 
100 105 110 

Glu Leu Leu lie Gin Gin Trp lie Gin Phe Met Met ser Arg Arg Arg 
115 120 125 

Leu Leu Ala cys Leu cys Lys His Lys Lys val ser Thr Asn Leu cys 
130 135 140 

Thr His Ser Phe Arg Lys Lys Gin val Arg 
145 150 

<210> 13 

<211> 332 

<212> DNA 

<213> CORONAVIRUS 



<220> 

<221> CDS 

<222> (36) . . (263) 

<223> 



<400> 13 

tgcctttgta agcacaagaa agtgagtacg aactt atg tac tea ttc gtt teg 53 

Met Tyr ser Phe val ser 
1 5 

gaa gaa aca ggt acg tta ata gtt aat age gta ctt ctt ttt ctt get 101 
Glu Glu Thr Gly Thr Leu lie Val Asn ser val Leu Leu Phe Leu Ala 
10 15 20 

ttc gtg gta ttc ttg eta gtc aca eta gec ate ctt act gcg ctt cga 149 
Phe val Val Phe Leu Leu Val Thr Leu Ala lie Leu Thr Ala Leu Arq 
25 30 35 
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ttg tgt gcg tac tgc tgc aat att gtt aac gtg agt tta gta aaa cca 
Leu cys Ala Tyr Cys Cys Asn He Val Asn VaT Ser Leu Val Lys Pro 
40 45 50 



<210> 


15 


<211> 


332 


<212> 


DNA 


<213> 


CORONAVIRUS 



197 



acg gtt tac gtc tac teg cgt gtt aaa aat ctg aac tct tct gaa gga 245 
Thr Val Tyr Val Tyr Ser Arg val Lys Asn Leu Asn Ser Ser Glu Gly 
55 60 65 70 

gtt cct gat ctt ctg gtc taaacgaact aactattatt attattctgt 293 
val Pro Asp Leu Leu Val 
75 

ttggaacttt aacattgett atcatggcag acaaeggta 332 

<210> 14 

<211> 76 

<212> PRT 

<213> CORONAVIRUS 



<400> 14 

Met Tyr Ser Phe val Ser Glu Glu Thr Gly Thr Leu lie Val Asn Ser 
1 5 10 15 

Val Leu Leu Phe Leu Ala Phe val Val Phe Leu Leu Val Thr Leu Ala 
20 25 30 

lie Leu Thr Ala Leu Arg Leu Cys Ala Tyr cys Cys Asn lie Val Asn 
35 40 45 

val ser Leu val Lys Pro Thr Val Tyr val Tyr Ser Arg val Lys Asn 
50 55 60 

Leu Asn ser Ser Glu Gly val Pro Asp Leu Leu val 
65 70 75 



<400> 15 

tgcctttgta agcacaagaa agtgagtacg aacttatgta etcattegtt teggaagaaa 60 

caggtaegtt aatagttaat agegtactte tttttcttgc tttcgtggta ttcttgetag 120 

tcacactagc catccttact gegcttcgat tgtgtgcgta ctgctgcaat attgttaacg 180 

tgagtttagt aaaaccaacg gtttaegtet actcgcgtgt taaaaatctg aactcttctg 240 

aaggagttcc tgatcttctg gtctaaacga actaactatt attattattc tgtttggaac 300 
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tttaacattg cttatcatgg cagacaacgg ta 332 

<210> 16 

<211> 708 

<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 

<222> (41).. (703) 

<223> 

<400> 16 

tattattatt attctgtttg gaactttaac attgcttatc atg gca gac aac ggt 55 

Met Ala Asp Asn Gly 
1 5 

act att acc gtt gag gag ctt aaa caa etc ctg gaa caa tgg aac eta 103 
Thr lie Thr val Glu Glu Leu Lys Gin Leu Leu Glu Gin Trp Asn Leu 
10 15 20 

gta ata ggt ttc eta ttc eta gee tgg att atg tta eta caa ttt gee 151 
Val lie Gly Phe Leu Phe Leu Ala Trp lie Met Leu Leu Gin Phe Ala 
25 30 35 

tat tct aat egg aac agg ttt ttg tac ata ata aag ctt gtt ttc etc 199 
Tyr Ser Asn Arg Asn Arg Phe Leu Tyr lie lie Lys Leu val Phe Leu 
40 ~ 45 50 

tgg etc ttg tgg cca gta aca ctt get tgt ttt gtg ctt get get gtc 247 
Trp Leu Leu Trp Pro Val Thr Leu Ala cys Phe Val Leu Ala Ala val 
55 60 " 65 

tac aga att aat tgg gtg act ggc gqg att gcg att gca atg get tgt 295 
Tyr Arg He Asn Trp Val Thr Gly Gly He Ala lie Ala Met Ala cys 
70 ~ 75 80 85 

att gta ggc ttg atg tgg ctt age tac ttc gtt get tec ttc agg ctg 343 
lie Val Gly Leu Met Trp Leu ser Tyr Phe val Ala ser Phe Arg Leu 
90 95 100 

ttt get cgt acc cgc tea atg tgg tea ttc aac cca gaa aca aac att 391 
Phe Ala Arg Thr Arg ser Met Trp ser Phe Asn Pro Glu Thr Asn lie 
105 110 115 

ctt etc aat gtg cct etc egg gqg aca att gtg acc aga ccg etc atg 439 
Leu Leu Asn Val Pro Leu Arg Gly Thr lie Val Thr Arg Pro Leu Met 
120 125 130 

gaa agt gaa ctt gtc att ggt get gtg ate att cgt ggt cac ttg cga 487 
Glu Ser Glu Leu Val lie Gly Ala Val lie lie Arg Gly His Leu Arg 
135 140 145 



atg gee gga cac tec eta ggg cgc tgt gac att aag gac ctg cca aaa 

Met Ala Gly His Ser Leu Gly Arg Cys Asp lie Lys Asp Leu Pro Lys 

150 155 160 165 
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gag ate act gtg get aca tea cga acg ctt tct tat tac aaa tta gga 
Glu lie Thr val Ala Thr ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly 
170 175 180 

gcg teg cag cgt gta ggc act gat tea ggt ttt get gca tac aac cgc 
Ala ser Gin Arg val Gly Thr Asp ser Gly phe Ala Ala Tyr Asn Arg 
185 190 195 



583 



631 



tac cgt att gga aac tat aaa tta aat aca gac cac gec ggt age aac 679 
Tyr Arg lie Gly Asn Tyr Lys Leu Asn Thr Asp His Ala Gly Ser Asn 
200 205 210 

gac aat att get ttg eta gta cag taagt 708 
Asp Asn lie Ala Leu Leu val Gin 
215 220 

<210> 17 

<211> 221 

<212> PRT 

<213> CORONAVIRUS 



<400> 17 

Met Ala Asp Asn Gly Thr lie Thr val Glu Glu Leu Lys Gin Leu Leu 
15 10 15 

Glu Gin Trp Asn Leu Val He Gly Phe Leu Phe Leu Ala Trp He Met 
20 25 30 

Leu Leu Gin Phe Ala Tyr Ser Asn Arg Asn Arg Phe Leu Tyr lie lie 
35 40 45 

Lys Leu val Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe 
50 55 60 

val Leu Ala Ala Val Tyr Arg lie Asn Trp Val Thr Gly Gly lie Ala 
65 70 * 75 80 

lie Ala Met Ala Cys lie Val Gly Leu Met Trp Leu Ser Tyr Phe val 
85 90 95 

Ala Ser phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp ser Phe Asn 
100 105 110 

Pro Glu Thr Asn lie Leu Leu Asn val Pro Leu Arg Gly Thr lie Val 
115 120 125 

Thr Arg Pro Leu Met Glu ser Glu Leu val He Gly Ala val lie lie 
130 135 140 

Arg Gly His Leu Arg Met Ala Gly His ser Leu Gly Arg cys Asp lie 
145 150 155 160 
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Lys Asp Leu Pro Lys Glu He Thr val Ala Thr ser Arg Thr Leu Ser 
165 170 ~ 175 

Tyr Tyr Lys Leu Gly Ala Ser Gin Arg Val Gly Thr Asp ser Gly Phe 
180 185 190 

Ala Ala Tyr Asn Arg Tyr Arg lie Gly Asn Tyr Lys Leu Asn Thr Asp 
195 ~ 200 205 

His Ala Gly ser Asn Asp Asn lie Ala Leu Leu val Gin 
210 215 220 

<210> 18 

<211> 769 

<212> DNA 

<213> CORONAVIRUS 



<400> 18 
cctgatcttc 


tggtctaaac 


gaactaacta 


ttattattat 


tctgtttgga 


actttaacat 


60 


tgcttatcat 


ggcagacaac 


ggtactatta 


ccgttgagga 


gcttaaacaa 


ctcctggaac 


120 


aatggaacct 


agtaataggt 


ttcctattcc 


tagcctggat 


tatgttacta 


caatttgcct 


180 


attctaatcg 


gaacaggttt 


ttgtacataa 


taaagcttgt 


tttcctctgg 


ctcttgtggc 


240 


cagtaacact 


tgcttgtttt 


gtgcttgctg 


ctgtctacag 


aattaattgg 


gtgactggcg 


300 


ggattgcgat 


tgcaatggct 


tgtattgtag 


gcttgatgtg 


gcttagctac 


ttcgttgctt 


360 


ccttcaggct 


gtttgctcgt 


acccgctcaa 


tgtggtcatt 


caacccagaa 


acaaacattc 


420 


ttctcaatgt 


gcctctccgg 


gggacaattg 


tgaccagacc 


gctcatggaa 


agtgaacttg 


480 


tcattggtgc 


tgtgatcatt 


cgtggtcact 


tgcgaatggc 


cggacactcc 


ctagggcgct 


540 


gtgacattaa 


ggacctgcca 


aaagagatca 


ctgtggctac 


atcacgaacg 


ctttcttatt 


600 


acaaattagg 


agcgtcgcag 


cgtgtaggca 


ctgattcagg 


ttttgctgca 


tacaaccgct 


660 


accgtattgg 


aaactataaa 


ttaaatacag 


accacgccgg 


tagcaacgac 


aatattgctt 


720 


tgctagtaca 


gtaagtgaca 


acagatgttt 


catcttgttg 


acttccagg 




769 



<210> 19 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 

<400> 19 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60 
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-gcxag xac 


dyxaciy lydL 


aacagatgtt tcatcttgtt 


gacttccagg ttacaatagc 


120 


agagaxax xg 




tgaggacttt caggattgct atttggaatc ttgacgttat 


180 


aataagxxca 


axag xgagac 


aaftaXtXaa acctrtaart 


aaaaaaaatt 


attcaaacit:t 


240 


agatgaxgaa 


yaaccxdxgy 


cxy v_ Layat v. a. Lv-v^a Laaaat 


naacataaaa 


attattctct 


300 


xccxgacaxx 


y aXXy La Lit 


aratrttaca aactatatra 


rtatcaoaaa 


■tataftaaaci 


360 


gtacgacxgx 


aCIdCLaaaa 


gaaccttgcc catcaggaac 


atacgagggc 


aattcaccat 


420 


txcacccxcx 


xgcxgacaax 


aaatttgcac taacttgcac 


tagcacacac 


tttgcttttg 


480 


cttgxgcxga 


cggxacx xga 


catacctatc agctgcgtgc 


aagatcagtt 


tcaccaaaac 


540 


xx u xcaxcag 


acaagayycig 


gttcaacaag agctctactc 


gccacttttt 


ctcattgttg 


600 


ctgcxctagt 


axxxxxaaxa 


ctttgcttca ccattaagag 


aaagacagaa 


tgaatgagct 


660 


cacxxxaaxx 


gacxxcxdxx 


tgtgcttttt agcctttctg 


ctattccttg 


ttttaataat 


720 


gcxxaxxaxa 


xxxxygxxxx 


cactcgaaat ccaggatcta gaagaacctt gtaccaaagt 


780 


cxaaacgaac 


at yddd X X X X 


tcattgtttt gacttgtatt tctctatgca gttgcatatg 


840 


cacxgxagxa 


cagcgcxgxg 


catctaataa acctcatgtg 


cttgaagatc 


cttgtaaggt 


900 


acaacacxag 


ggyxdd tail 


tatagcactg cttggctttg 


tgctctagga 


aaggttttac 


960 


cttttcatag 


atggcacact 


atggttcaaa catgcacacc 


taatgttact 


atcaactgtc 


1 ron 
JXmU 


aagatccagc 


tggtggtgcg 


cttatagcta ggtgttggta 


ccttcatgaa 


ggtcaccaaa 


1080 


ctgctgcatt 


tagagacgta 


cttgttgttt taaataaacg 


aacaaattaa 


aatgtctgat 


1140 


aatggacccc 


aatcaaacca 


acgtagtgcc ccccgcatta 


catttggtgg 


acccacagat 


1200 


tcaactgaca 


ataaccagaa 


tggaggacgc a 






1231 



<210> 20 

<211> 1242 

<212> DNA 

<213> CORONAVIRUS 



<400> 20 

gcatacaacc gctaccgtat 


tggaaactat 


aaattaaata 


cagaccacgc 


cggtagcaac 


60 


gacaatattg ctttgctagt 


acagtaagtg 


acaacagatg 


tttcatcttg 


ttgacttcca 


120 


ggttacaata gcagagatat 


tgattatcat 


tatgaggact 


ttcaggattg 


ctatttggaa 


180 


tcttgacgtt ataataagtt 


caatagtgag 


acagttattt 


aagcctctaa 


ctaagaagaa 


240 


ttattcggag ttagatgatg 


aagaacctat 


ggagttagat 


tatccataaa 


acgaacatga 


300 


aaattattct cttcctgaca 


ttgattgtat ttacatcttg 


cgagctatat 


cactatcagg 


360 


agtgtgttag aggtacgact 


gtactactaa 


aagaaccttg 


cccatcagga 


acatacgagg 


420 


gcaattcacc atttcaccct 


cttgctgaca 


ataaatttgc 


actaacttgc 


actagcacac 


480 
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actttgcttt tgcttgtgct 


gacggtactc 


gacataccta tcagctgcgt 


gcaagatcag 


540 


tttcaccaaa acttttcatc 


agacaagagg 


aggttcaaca 


agagctctac 


tcgccacttt 


600 


ttctcattgt tgctgctcta 


gtatttttaa 


tactttgctt 


caccattaag 


agaaagacag 


660 


aatgaatgag ctcactttaa 


ttgacttcta 


tttgtgcttt 


ttagcctttc 


tgctattcct 


720 


tgttttaata atgcttatta 


tattttggtt 


ttcactcgaa atccaggatc tagaagaacc 


780 


ttgtaccaaa gtctaaacga 


acatgaaact 


tctcattgtt 


ttgacttgta 


tttctctatg 


840 


cagttgcata tgcactgtag 


tacagcgctg 


tgcatctaat 


aaacctcatg 


tgcttgaaga 


900 


tccttgtaag gtacaacact 


aggggtaata 


cttatagcac 


tgcttggctt 


tgtgctctag 


960 


gaaaggtttt accttttcat 


agatggcaca 


ctatggttca 


aacatgcaca 


cctaatgtta 


1020 


ctatcaactg tcaagatcca 


gctggtggtg 


cgcttatagc 


taggtgttgg 


taccttcatg 


1080 


aaggtcacca aactgctgca 


tttagagacg 


tacttgttgt 


tttaaataaa 


cgaacgaatt 


1140 


aaaatgtctg ataatggacc 


ccaatcaaac 


caacgtagtg 


ccccccgcat 


tacatttggt 


1200 


ggacccacag attcaactga 


caataaccag 


aatggaggac 


gc 




1242 



<210> 21 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 

<222> (86).. (274) 

<223> 

<400> 21 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60 

ttgctagtac agtaagtgac aacag atg ttt cat ctt gtt gac ttc cag gtt 112 

Met Phe His Leu Val Asp Phe Gin val 
1 5 

aca ata gca gag ata ttg att ate att atg agg act ttc agg att get 160 

Thr He Ala Glu lie Leu lie lie lie Met Arg Thr Phe Arg lie Ala 
10 15 20 25 

att tgg aat ctt gac gtt ata ata agt tea ata gtq aga caa tta ttt 208 
He Trp Asn Leu Asp Val lie lie Ser Ser lie Val Arg Gin Leu Phe 
30 35 40 

aag cct eta act aag aag aat tat teg gag tta gat gat gaa gaa cct 256 
Lys pro Leu Thr Lys Lys Asn Tyr ser Glu Leu Asp Asp Glu Glu pro 
45 50 55 

atg gag tta gat tat cca taaaacgaac atgaaaatta ttctcttcct 304 
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Met Glu Leu Asp Tyr Pro 
60 



gacattgatt 


gtatttacat 


cttgcgagct atatcactat caggagtgtg 


ttagaggtac 


364 


gactgtacta 


ctaaaagaac 


cttgcccatc aggaacatac gagggcaatt 


caccatttca 


424 


ccctcttgct 


gacaataaat 


ttgcactaac 


ttgcactagc acacactttg 


cttttgcttg 


484 


tgctgacggt 


actcgacata 


cctatcagct 


gcgtgcaaga tcagtttcac 


caaaactttt 


544 


catcagacaa 


gaggaggttc 


aacaagagct 


ctactcgcca ctttttctca 


ttgttgctgc 


604 


tctagtattt 


ttaatacttt 


gcttcaccat taagagaaag acagaatgaa tgagctcact 


664 


ttaattgact 


tctatttgtg 


ctttttagcc 


tttctgctat tccttgtttt 


aataatgctt 


724 


attatatttt 


ggttttcact 


cgaaatccag 


gatctagaag aaccttgtac 


caaagtctaa 


784 


acgaacatga 


aacttctcat 


tgttttgact 


tgtatttctc tatgcagttg 


catatgcact 


844 


gtagtacagc 


gctgtgcatc 


taataaacct 


catgtgcttg aagatccttg 


taaggtacaa 


904 


cactaggggt 


aatacttata 


gcactgcttg 


gctttgtgct ctaggaaagg 


ttttaccttt 


964 


tcatagatgg 


cacactatgg 


ttcaaacatg 


cacacctaat gttactatca 


actgtcaaga 


1024 


tccagctggt 


ggtgcgctta 


tagctaggtg 


ttggtacctt catgaaggtc 


accaaactgc 


1084 


tgcatttaga 


gacgtacttg 


ttgttttaaa 


taaacgaaca aattaaaatg 


tctgataatg 


1144 


gaccccaatc 


aaaccaacgt 


agtgcccccc 


gcattacatt tggtggaccc 


acagattcaa 


1204 


ctgacaataa 


ccagaatgga 


ggacgca 






1231 



<210> 22 

<211> 63 

<212> PRT 

<213> CORONAVIRUS 



<400> 22 

Met Phe His Leu Val Asp Phe Gin val Thr lie Ala Glu lie Leu lie 
15 10 15 

He He Met Arg Thr Phe Arg lie Ala lie Trp Asn Leu Asp val lie 
20 25 30 

lie ser ser lie Val Arg Gin Leu Phe Lys Pro Leu Thr Lys Lys Asn 
35 40 45 

Tyr ser Glu Leu Asp Asp Glu Glu Pro Met Glu Leu Asp Tyr Pro 
50 55 60 



<210> 23 
<211> 1231 
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<212> DNA 

<213> CORONAVIRUS 



<220> 

<221> CDS 

<222> (285). .(650) 

<223> 



<400> 23 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60 

ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 120 

agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 180 

aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 240 

agatgatgaa gaacctatgg agttagatta tccataaaac gaac atg aaa att att 296 

Met Lys lie lie 

etc ttc ctg aca ttg att gta ttt aca tct tgc gag eta tat cac tat 344 
Leu Phe Leu Thr Leu lie val Phe Thr ser cys Glu Leu Tyr His Tyr 
5 10 15 20 

cag gag tgt gtt aga ggt acg act gta eta eta aaa gaa cct tgc cca 392 
Gin Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys Glu Pro cys Pro 
25 30 35 

tea gqa aca tac gag ggc aat tea cca ttt cac cct ctt get gac aat 440 
Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro Leu Ala Asp Asn 
40 45 50 

aaa ttt gca eta act tgc act age aca cac ttt get ttt get tgt get 488 
Lys Phe Ala Leu Thr Cys Thr Ser Thr His Phe Ala Phe Ala cys Ala 
55 60 65 

gac ggt act cga cat ace tat cag ctg cgt gca aga tea gtt tea cca 536 
Asp Gly Thr Arg His Thr Tyr Gin Leu Arg Ala Arg Ser val ser Pro 
70 75 ^ 80 



aaa ctt ttc ate aga caa gag gag gtt caa caa gag etc tac teg cca 584 
Lys Leu Phe lie Arg Gin Glu Glu val Gin Gin Glu Leu Tyr ser Pro 
85 90 95 100 



ctt ttt etc att gtt get get eta gta ttt tta ata ctt tgc ttc acc 632 
Leu Phe Leu lie Val Ala Ala Leu Val Phe Leu lie Leu Cys Phe Thr 
105 110 115 

att aag aga aag aca gaa tgaatgagct cactttaatt gacttctatt 680 
lie Lys Arg Lys Thr Glu 
120 

tgtgcttttt agectttctg ctattccttg ttttaataat gcttattata ttttggtttt 740 

cactcgaaat ccaggatcta gaagaacctt gtaccaaagt ctaaacgaac atgaaacttc 800 

tcattgtttt gacttgtatt tetctatgea gttgcatatg cactgtagta cagcgctgtg 860 

catctaataa acctcatgtg cttgaagatc cttgtaaggt acaacactag gggtaatact 920 
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tatagcactg cttggctttg tgctctagga aaggttttac cttttcatag atggcacact 980 

atggttcaaa catgcacacc taatgttact atcaactgtc aagatccagc tggtggtgcg 1040 

cttatagcta ggtgttggta ccttcatgaa ggtcaccaaa ctgctgcatt tagagacgta 1100 

cttgttgttt taaataaacg aacaaattaa aatgtctgat aatggacccc aatcaaacca 1160 

acgtagtgcc ccccgcatta catttggtgg acccacagat tcaactgaca ataaccagaa 1220 

tggaggacgc a 1231 

<210> 24 

<211> 122 

<212> PRT 

<213> CORONAVIRUS 



<400> 24 

Met Lys lie lie Leu Phe Leu Thr Leu lie Val Phe Thr ser cys Glu 
15 10 15 

Leu Tyr His Tyr Gin Glu Cys val Arg Gly Thr Thr val Leu Leu Lys 
20 25 30 

Glu Pro Cys Pro Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro 
35 40 45 

Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Thr ser Thr His Phe Ala 
50 55 60 

Phe Ala cys Ala Asp Gly Thr Arg His Thr Tyr Gin Leu Arg Ala Arg 
65 70 75 ^ 80 

Ser Val ser Pro Lys Leu Phe lie Arg Gin Glu Glu Val Gin Gin Glu 
85 90 95 

Leu Tyr Ser Pro Leu Phe Leu lie Val Ala Ala Leu Val Phe Leu He 
100 105 110 

Leu cys Phe Thr lie Lys Arg Lys Thr Glu 
115 120 

<210> 25 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 
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<220> 

<221> CDS 

<222> (650) . . (781) 

<223> 



<400> 25 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60 

ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 120 

agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 180 

aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 240 

agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct 300 

tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag 360 

gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat 420 

ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg 480 

cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac 540 

ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg 600 

ctgctctagt atttttaata ctttgcttca ccattaagag aaagacaga atg aat gag 658 

Met Asn Glu 
1 

etc act tta att gac ttc tat ttg tgc ttt tta gec ttt ctg eta ttc 706 
Leu Thr Leu lie Asp Phe Tyr Leu Cys Phe Leu Ala Phe Leu Leu Phe 
5 10 15 

ctt gtt tta ata atg ctt att ata ttt tgg ttt tea etc gaa ate eag 754 
Leu val Leu lie Met Leu He lie Phe Trp Phe ser Leu Glu lie Gin 
20 25 30 35 

gat eta gaa gaa cct tgt acc aaa gtc taaacgaaca tgaaacttct 801 
Asp Leu Glu Glu Pro cys Thr Lys val 
40 

cattgttttg acttgtattt etctatgeag ttgcatatgc actgtagtac agcgctgtgc 861 

atctaataaa cctcatgtgc ttgaagatcc ttgtaaggta caacactagg ggtaatactt 921 

atagcactgc ttggctttgt gctctaggaa aggttttacc ttttcataga tggcacacta 981 

tggttcaaac atgcacacct aatgttacta tcaactgtca agatccagct ggtggtgcgc 1041 

ttatagctag gtgttggtac cttcatgaag gtcaccaaac tgctgcattt agagaegtae 1101 

ttgttgtttt aaataaacga acaaattaaa atgtctgata atggacccca atcaaaccaa 1161 

cgtagtgccc cccgcattac atttggtgga cccacagatt caactgacaa taaccagaat 1221 

ggaggacgea 12 31 

<210> 26 
<211> 44 
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<212> PRT 

<213> CORONAVIRUS 



<400> 26 

Met Asn Glu Leu Thr Leu lie Asp Phe Tyr Leu cys Phe Leu Ala Phe 
1 5 10 15 

Leu Leu Phe Leu val Leu lie Met Leu lie lie Phe Trp Phe ser Leu 
20 25 30 

Glu lie Gin Asp Leu Glu Glu Pro Cys Thr Lys val 
35 40 

<210> 27 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 



<220> 

<221> CDS 

<222> (791) . . C907) 

<223> 



<400> 27 
taccgtattg 


gaaactataa 


attaaataca 


gaccacgccg 


gtagcaacga 


caatattget 


60 


ttgctagtac 


agtaagtgac 


aacagatgtt 


tcatcttgtt 


gacttccagg 


ttacaatagc 


120 


agagatattg 


attatcatta 


tgaggacttt 


caggattget 


atttggaatc 


ttgacgttat 


180 


aataagttca 


atagtgagac 


aattatttaa 


gcctctaact 


aagaagaatt 


atteggagtt 


240 


agatgatgaa 


gaacctatgg 


agttagatta 


tccataaaac 


gaacatgaaa 


attattctct 


300 


tcctgacatt 


gattgtattt 


acatcttgeg 


agctatatca 


ctatcaggag 


tgtgttagag 


360 


gtacgactgt 


actactaaaa 


gaaccttgcc 


catcaggaac 


atacgagggc 


aattcaccat 


420 


ttcaccctct 


tgctgacaat 


aaatttgeae 


taacttgeae 


tagcacacac 


tttgcttttg 


480 


cttgtgctga 


cggtactcga 


catacctatc 


agctgcgtgc 


aagatcagtt 


tcaccaaaac 


540 


ttttcatcag 


acaagaggag 


gttcaacaag 


agctctactc 


gecacttttt 


ctcattgttg 


600 


ctgctctagt 


atttttaata 


etttgettea 


ccattaagag 


aaagacagaa 


tgaatgagct 


660 


cactttaatt 


gacttctatt 


tgtgcttttt 


agectttctg 


ctattccttg 


ttttaataat 


720 


gcttattata 


ttttggtttt 


cactcgaaat 


ccaggatcta 


gaagaacctt 


gtaccaaagt 


780 


ctaaacgaac 


atg aaa ctt etc att gtt ttg act tgt att tct 


eta tgc 


829 
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Met Lys Leu Leu lie Val Leu Thr cys lie ser Leu Cys 
15 10 

agt tgc ata tgc act gta gta cag cgc tgt gca tct aat aaa cct cat 877 
ser Cys lie cys Thr val Val Gin Arg cys Ala Ser Asn Lys Pro His 
15 20 25 

gtg ctt gaa gat cct tgt aag gta caa cac taggggtaat acttatagca 927 
val Leu Glu Asp Pro Cys Lys val Gin His 
30 35 

ctgcttggct ttgtgctcta ggaaaggttt taccttttca tagatggcac actatggttc 987 

aaacatgcac acctaatgtt actatcaact gtcaagatcc agctggtggt gcgcttatag 1047 

ctaggtgttg gtaccttcat gaaggtcacc aaactgctgc atttagagac gtacttgttg 1107 

ttttaaataa acgaacaaat taaaatgtct gataatggac cccaatcaaa ccaacgtagt 1167 

gccccccgca ttacatttgg tggacccaca gattcaactg acaataacca gaatggagga 1227 

cgca 1231 

<210> 28 

<211> 39 

<212> PRT 

<213> CORONAVIRUS 



<400> 28 

Met Lys Leu Leu lie Val Leu Thr cys lie ser Leu Cys ser Cys lie 
15 10 15 

cys Thr Val Val Gin Arg cys Ala ser Asn Lys Pro His Val Leu Glu 
20 25 30 

Asp Pro Cys Lys Val Gin His 
35 

<210> 29 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 



<220> 

<221> CDS 

<222> (876).. (U27) 
<223> 
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<400> 29 
taccgtattg 


gaaactataa 


attaaataca 


gaccacgccg 


gtagcaacga 


caatattgct 


60 


ttgctagtac 


agtaagtgac 


aacagatgtt 


tcatcttgtt 


gacttccagg 


ttacaatagc 


120 


agagatattg 


attatcatta 


tgaggacttt 


caggattgct 


atttggaatc 


ttgacgttat 


180 


aataagttca 


atagtgagac 


aattatttaa 


gcctctaact 


aagaagaatt 


attcggagtt 


240 


agatgatgaa 


gaacctatgg 


agttagatta 


tccataaaac 


gaacatgaaa 


attattctct 


300 


tcctgacatt 


gattgtattt 


acatcttgcg 


agctatatca 


ctatcaggag 


tgtgttagag 


360 


gtacgactgt 


actactaaaa 


gaaccttgcc 


catcaggaac 


atacgagggc 


aattcaccat 


420 


ttcaccctct 


tgctgacaat 


aaatttgcac 


taacttgcac 


tagcacacac 


tttgcttttg 


480 


cttgtgctga 


cggtactcga 


catacctatc 


agctgcgtgc 


aagatcagtt 


tcaccaaaac 


540 


ttttcatcag 


acaagaggag 


gttcaacaag 


agctctactc 


gccacttttt 


ctcattgttg 


600 


ctgctctagt 


atttttaata 


ctttgcttca 


ccattaagag 


aaagacagaa 


tgaatgagct 


660 


cactttaatt 


aacttctatt 


tatacttttt 

i.y ty V L L L L L 


agcctttctg 


ctattccttg 


ttttaataat 


720 


gcttattata 


ttttggtttt 


cactcgaaat 


ccaggatcta 


gaagaacctt 


gtaccaaagt 


780 


ctaaacgaac 


atgaaacttc 


tcattgtttt 


gacttgtatt 


tctctatgca 


gttgcatatg 


840 


cactgtagta 


cagcgctgtg 


catctaataa 


acctc atg tgc ttg aag 
Met Cys Leu Lys 
1 


ate ctt 
lie Leu 
5 


893 



gta agg tac aac act agg ggt aat act tat age act get tgg ctt tgt 941 
Val Arg Tyr Asn Thr Arg Gly Asn Thr Tyr Ser Thr Ala Trp Leu Cys 
10 15 20 

get eta gga aag gtt tta cct ttt cat aga tgg cac act atg gtt caa 989 
Ala Leu Gly Lys Val Leu Pro Phe His Arg Trp His Thr Met Val Gin 
25 30 35 

aca tgc aca cct aat gtt act ate aac tgt caa gat cca get ggt ggt 1037 
Thr Cys Thr Pro Asn val Thr lie Asn cys Gin Asp Pro Ala Gly Gly 
40 45 50 

gcg ctt ata get agg tgt tgg tac ctt cat gaa ggt cac caa act get 1085 
Ala Leu lie Ala Arg cys Trp Tyr Leu His Glu Gly His Gin Thr Ala 
55 60 65 70 

gca ttt aga gac gta ctt gtt gtt tta aat aaa cga aca aat 1127 
Ala Phe Arg Asp Val Leu Val Val Leu Asn Lys Arg Thr Asn 
75 80 

taaaatgtct gataatggac cccaatcaaa ecaaegtagt gccccccgca ttacatttgg 1187 

tggacccaca gattcaactg acaataacca gaatggagga cgea 1231 

<210> 30 

<211> 84 

<212> PRT 

<213> CORONAVIRUS 
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<400> 30 

Met cys Leu Lys lie Leu Val Arg Tyr Asn Thr Arg Gly Asn Thr Tyr 
15 10 15 

Ser Thr Ala Trp Leu cys Ala Leu Gly Lys val Leu Pro Phe His Arg 
20 25 30 

Trp His Thr Met Val Gin Thr cys Thr Pro Asn val Thr lie Asn cys 
35 40 45 

Gin Asp Pro Ala Gly Gly Ala Leu lie Ala Arg Cys Trp Tyr Leu His 
50 55 60 

Glu Gly His Gin Thr Ala Ala Phe Arg Asp Val Leu Val Val Leu Asn 
65 70 75 80 

Lys Arg Thr Asn 



<210> 31 

<211> 21221 

<212> DNA 

<213> CORONAVIRUS 



<400> 31 
atggagagcc 


ttgttcttgg 


tgtcaacgag 


aaaacacacg 


tccaactcag 


tttgcctgtc 


60 


cttcaggtta 


gagacgtgct 


agtgcgtggc 


ttcggggact 


ctgtggaaga 


ggccctatcg 


120 


gaggcacgtg 


aacacctcaa 


aaatggcact 


tgtggtctag tagagctgga 


aaaaggcgta 


180 


ctgccccagc 


ttgaacagcc 


ctatgtgttc 


attaaacgtt 


ctgatgcctt 


aagcaccaat 


240 


cacggccaca 


aggtcgttga 


gctggttgca 


gaaatggacg 


gcattcagta 


cggtcgtagc 


300 


ggtataacac 


tgggagtact 


cgtgccacat 


gtgggcgaaa 


ccccaattgc 


ataccgcaat 


360 


gttcttcttc 


gtaagaacgg 


taataaggga 


gccggtggtc 


atagctatgg 


catcgatcta 


420 


aagtcttatg 


acttaggtga 


cgagcttggc 


actgatccca ttgaagatta 


tgaacaaaac 


480 


tggaacacta 


agcatggcag 


tggtgcactc 


cgtgaactca 


ctcgtgagct 


caatggaggt 


540 


gcagtcactc 


gctatgtcga 


caacaatttc 


tgtggcccag 


atgggtaccc 


tcttgattgc 


600 


atcaaagatt 


ttctcgcacg 


cgcgggcaag 


tcaatgtgca 


ctctttccga 


acaacttgat 


660 


tacatcgagt 


cgaagagagg 


tgtctactgc 


tgccgtgacc atgagcatga 


aattgcctgg 


720 


ttcactgagc 


gctctgataa 


gagctacgag 


caccagacac 


ccttcgaaat 


taagagtgcc 


780 


aagaaatttg 


acactttcaa 


aggggaatgc 


ccaaagtttg tgtttcctct 


taactcaaaa 


840 


gtcaaagtca 


ttcaaccacg 


tgttgaaaag 


aaaaagactg 


agggtttcat 


ggggcgtata 


900 


cgctctgtgt 


accctgttgc 


atctccacag 


gagtgtaaca 


atatgcactt 


gtctaccttg 


960 
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atgaaatgta 


atcattgcga 


tgaagtttca 


tggcagacgt 


gcgactttct 


gaaagccact 


1020 


tgtgaacatt 


gtggcactga 


aaatttagtt 


attgaaggac 


ctactacatg 


tgggtaccta 


1080 


cctactaatg 


ctgtagtgaa 


aatgccatgt 


cctgcctgtc 


aagacccaga 


gattggacct 


1140 


gagcatagtg 


ttgcagatta 


tcacaaccac 


tcaaacattg 


aaactcgact 


ccgcaaggga 


1200 


ggtaggacta 


gatgttttgg 


aggctgtgtg 


tttgcctatg 


ttggctgcta 


taataagcgt 


1260 


gcctactggg 


ttcctcgtgc 


tagtgctgat 


attggctcag 


gccatactgg 


cattactggt 


1320 


gacaatgtgg 


agaccttgaa 


tgaggatctc 


cttgagatac 


tgagtcgtga 


acgtgttaac 


1380 


attaacattg 


ttggcgattt 


tcatttgaat 


gaagaggttg 


ccatcatttt 


ggcatctttc 


1440 


tctgcttcta 


caagtgcctt 


tattgacact 


ataaagagtc 


ttgattacaa 


gtctttcaaa 


1500 


accattgttg 


agtcctgcgg 


taactataaa 


gttaccaagg 


gaaagcccgt 


aaaaggtgct 


1560 


tggaacattg 


gacaacagag 


atcagtttta 


acaccactgt 


gtggttttcc 


ctcacaggct 


1620 


gctggtgtta 


tcagatcaat 


ttttgcgcgc 


acacttgatg 


cagcaaacca 


ctcaattcct 


1680 


gatttgcaaa 


gagcagctgt 


caccatactt 


gatggtattt 


ctgaacagtc 


attacgtctt 


1740 


gtcgacgcca 


tggtttatac 


ttcagacctg 


ctcaccaaca 


gtgtcattat 


tatggcatat 


1800 


gtaactggtg 


gtcttgtaca 


acagacttct 


cagtggttgt 


ctaatctttt 


gggcactact 


1860 


gttgaaaaac 


tcaggcctat 


ctttgaatgg 


attgaggcga 


aacttagtgc 


aggagttgaa 


1920 


tttctcaagg 


atgcttggga 


gattctcaaa 


tttctcatta 


caggtgtttt 


tgacatcgtc 


1980 


aagggtcaaa 


tacaggttgc 


ttcagataac 


atcaaggatt 


gtgtaaaatg 


cttcattgat 


2040 


gttgttaaca 


aggcactcga 


aatgtgcatt 


gatcaagtca 


ctatcgctgg 


cgcaaagttg 


2100 


cgatcactca 


acttaggtga 


agtcttcatc 


gctcaaagca 


agggacttta 


ccgtcagtgt 


2160 


atacgtggca 


aggagcagct 


gcaactactc 


atgcctctta 


aggcaccaaa 


agaagtaacc 


2220 


tttcttgaag 


gtgattcaca 


tgacacagta 


cttacctctg 


aggaggttgt 


tctcaagaac 


2280 


ggtgaactcg 


aagcactcga 


gacgcccgtt 


gatagcttca 


caaatggagc 


tatcgttggc 


2340 


acaccagtct 


gtgtaaatgg 


cctcatgctc 


ttagagatta 


aggacaaaga 


acaatactgc 


2400 


gcattgtctc 


ctggtttact 


ggctacaaac 


aatgtctttc 


gcttaaaagg 


gggtgcacca 


2460 


attaaaggtg 


taacctttgg 


agaagatact 


gtttgggaag 


ttcaaggtta 


caagaatgtg 


2520 


agaatcacat 


ttgagcttga 


tgaacgtgtt 


gacaaagtgc 


ttaatgaaaa 


gtgctctgtc 


2580 


tacactgttg 


aatccggtac 


cgaagttact 


gagtttgcat 


gtgttgtagc 


agaggctgtt 


2640 


gtgaagactt 


tacaaccagt 


ttctgatctc 


cttaccaaca 


tgggtattga 


tcttgatgag 


2700 


tggagtgtag 


ctacattcta 


cttatttgat 


gatgctggtg 


aagaaaactt 


ttcatcacgt 


2760 


atgtattgtt 


ccttttaccc 


tccagatgag 


gaagaagagg 


acgatgcaga 


gtgtgaggaa 


2820 


gaagaaattg 


atgaaacctg 


tgaacatgag 


tacggtacag 


aggatgatta 


tcaaggtctc 


2880 


cctctggaat 


ttggtgcctc 


agctgaaaca 


gttcgagttg 


aggaagaaga 


agaggaagac 


2940 


tggctggatg 


atactactga 


gcaatcagag 


attgagccag 


aaccagaacc 


tacacctgaa 


3000 
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gaaccagtta atcagtttac tggttattta aaacttactg acaatgttgc cattaaatgt 


3060 


gttgacatcg 


ttaaggaggc 


acaaagtgct 


aatcctatgg tgattgtaaa tgctgctaac 


3120 


atacacctga aacatggtgg tggtgtagca ggtgcactca acaaggcaac caatggtgcc 


3180 


atgcaaaagg 


agagtgatga 


ttacattaag 


ctaaatggcc 


ctcttacagt 


aggaggQtct 


3240 


tgtttgcttt 


ctggacataa tcttgctaag 


aagtgtctgc 


atgttgttgg 


acctaaccta 


3300 


aatgcaggtg 


aggacatcca 


gcttcttaag 


gcagcatatg 


aaaatttcaa 


ttcacaggac 


3360 


atcttacttg 


caccattgtt gtcagcaggc 


atatttggtg 


ctaaaccact 


tcagtcttta 


3420 


caagtgtgcg 


tgcagacggt 


«t» /M >4v M &m M ytfft A 

xcgxacacag 


gtttatattg 


cagtcaatga 


caaagctctt 


3480 


tatgagcagg 


xxgxcaxgga 


xxaxcxxgax 


aacctgaagc 


ctagagtgga 


agcacctaaa 


3540 


caagaggagc 


caccaaacac 


agaagattcc 


aaaactgagg 


agaaatctgt 


cgtacagaag 


3600 


cctgtcgatg 


xgaagccaaa 


aa x xaaggcc 


tgcattgatg 


aggttaccac 


aacactggaa 


3660 


gaaacxaagx 


xxcxxaccaa 


xaagxxacxc 


ttgtttgctg 


atatcaatgg 


taagctttac 


3720 


caxgaxxcxc 


agaacaxgcx 


xagaggxgaa 


gatatgtctt 


tccttgagaa 


ggatgcacct 


3780 


xacaxggxag 


gxgaxgxxax 


cacxagxggx 


gatatcactt 


gtgttgtaat 


accctccaaa 


3840 


aaggctggtg 


gcactactga 


/-l —\ «4— g~% y— 4K y— • 4V y—> *-» 

gaxgcxcxca 


agagctttga 


agaaagtgcc 


agttgatgag 


3900 


xaxaxaacca 


cgtaccctgg 


acaaggatgt 


gctggttata 


cacttgagga 


agctaagact 


3960 


gcxcxxaaga 


aatgcaaatc 


xgcaxxxxa x 


gtactacctt 


cagaagcacc 


taatgctaag 


4020 


gaagagaxxc 


taggaactgt 


atcctggaati 


ttgagagaaa tgcttgctca 


tgctgaagag 


4080 


acaagaaaat 


taatgcctat 


atgcatggat 


gttagagcca 


taatggcaac 


catccaacgt 


4140 


aagtataaag 


gaattaaaat 


tcaagagggc 


atcgttgact 


atggtgtccg 


attcttcttt 


4200 


tatactagta 


aagagcctgt 


agcttctatt 


attacgaagc 


tgaactctct 


aaatgagccg 


4260 


cttgtcacaa 


tgccaattgg 


ttatgtgaca 


catggtttta 


atcttgaaga 


ggctgcgcgc 


4320 


tgtatgcgtt 


ctcttaaagc 


tcctgccgta 


gtgtcagtat 


catcaccaga 


tgctgttact 


4380 


acatataatg 


gatacctcac 


ttcgtcatca 


aagacatctg 


aggagcactt 


tgtagaaaca 


4440 


gtttctttgg 


ctggctctta 


cagagattgg 


tcctattcag 


gacagcgtac 


agagttaggt 


4500 


gttgaatttc ttaagcgtgg 


tgacaaaatt 


gtgtaccaca 


ctctggagag 


ccccgtcgag 


4560 


tttcatcttg 


acggtgaggt 


tctttcactt 


gacaaactaa agagtctctt 


atccctgcgg 


4620 


gaggttaaga 


ctataaaagt 


gttcacaact 


gtggacaaca 


ctaatctcca 


cacacagctt 


4680 


gtggatatgt 


ctatgacata 


tggacagcag 


tttggtccaa 


catacttgga 


tggtgctgat 


4740 


gttacaaaaa 


ttaaacctca 


tgtaaatcat 


gagggtaaga 


ctttctttgt 


actacctagt 


4800 


gatgacacac 


tacgtagtga 


agctttcgag 


tactaccata 


ctcttgatga 


gagttttctt 


4860 


ggtaggtaca tgtctgcttt aaaccacaca 


aagaaatgga 


aatttcctca 


agttggtggt 


4920 


ttaacttcaa 


ttaaatgggc 


tgataacaat 


tgttatttgt 


ctagtgtttt 


attagcactt 


4980 


caacagcttg aagtcaaatt caatgcacca gcacttcaag aggcttatta tagagcccgt 


5040 
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gctggtgatg 


ctgctaactt 


ttgtgcactc 


atactcgctt 


acagtaataa 


aactgttggc 


5100 


gagcttggtg 


atgtcagaga 


aactatgacc 


catcttctac 


agcatgctaa 


tttggaatct 


5160 


gcaaagcgag 


ttcttaatgt 


ggtgtgtaaa 


cattgtggtc 


agaaaactac 


taccttaacg 


5220 


ggtgtagaag 


ctgtgatgta 


tatgggtact 


ctatcttatg 


ataatcttaa 


gacaggtgtt 


5280 


tccattccat 


gtgtgtgtgg 


tcgtgatgct 


acacaatatc 


tagtacaaca 


agagtcttct 


5340 


tttgttatga 


tgtctgcacc 


acctgctgag 


tataaattac 


agcaaggtac 


attcttatgt 


5400 


gcgaatgagt 


acactggtaa 


ctatcagtgt 


ggtcattaca 


ctcatataac 


tgctaaggag 


5460 


accctctatc 


gtattgacgg 


agctcacctt 


acaaagatgt 


cagagtacaa 


aggaccagtg 


5520 


actgatgttt 


tctacaagga 


aacatcttac 


actacaacca 


tcaagcctgt 


gtcgtataaa 


5580 


ctcgatggag 


ttacttacac 


agagattgaa 


ccaaaattgg 


atgggtatta 


taaaaaggat 


5640 


aatgcttact 


atacagagca 


gcctatagac 


cttgtaccaa 


ctcaaccatt 


accaaatgcg 


5700 


agttttgata 


atttcaaact 


cacatgttct 


aacacaaaat 


ttgctgatga 


tttaaatcaa 


5760 


atgacaggct 


tcacaaagcc 


agcttcacga 


gagctatctg 


tcacattctt 


cccagacttg 


5820 


aatggcgatg 


tagtggctat 


tgactataga 


cactattcag 


cgagtttcaa 


gaaaggtgct 


5880 


aaattactgc 


ataagccaat 


tgtttggcac 


attaaccagg 


ctacaaccaa 


gacaacgttc 


5940 


aaaccaaaca 


cttggtgttt 


acgttgtctt 


tggagtacaa 


agccagtaga 


tacttcaaat 


6000 


tcatttgaag 


ttctggcagt 


agaagacaca 


caaggaatgg 


acaatcttgc 


ttgtgaaagt 


6060 


caacaaccca 


cctctgaaga 


agtagtggaa 


aatcctacca 


tacagaagga 


agtcatagag 


6120 


tgtgacgtga 


aaactaccga 


agttgtaggc 


aatgtcatac 


ttaaaccatc 


agatgaaggt 


6180 


gttaaagtaa 


cacaagagtt 


aggtcatgag 


gatcttatgg 


ctgcttatgt 


ggaaaacaca 


6240 


agcattacca 


ttaagaaacc 


taatgagctt 


tcactagcct 


taggtttaaa 


aacaattgcc 


6300 


actcatggta 


ttgctgcaat 


taatagtgtt 


ccttggagta 


aaattttggc 


ttatgtcaaa 


6360 


ccattcttag 


gacaagcagc 


aattacaaca 


tcaaattgcg 


ctaagagatt 


agcacaacgt 


6420 


gtgtttaaca 


attatatgcc 


ttatgtgttt 


acattattgt 


tccaattgtg 


tacttttact 


6480 


aaaagtacca 


attctagaat 


tagagcttca 


ctacctacaa 


ctattgctaa 


aaatagtgtt 


6540 


aagagtgttg 


ctaaattatg 


tttggatgcc 


ggcattaatt 


atgtgaagtc 


acccaaattt 


6600 


tctaaattgt 


tcacaatcgc 


tatgtggcta 


ttgttgttaa 


gtatttgctt 


aggttctcta 


6660 


atctgtgtaa 


ctgctgcttt 


tggtgtactc 


ttatctaatt 


ttggtgctcc 


ttcttattgt 


6720 


aatggcgtta 


gagaattgta 


tcttaattcg 


tctaacgtta 


ctactatgga 


tttctgtgaa 


6780 


ggttcttttc 


cttgcagcat 


ttgtttaagt 


ggattagact 


cccttgattc 


ttatccagct 


6840 


cttgaaacca 


ttcaggtgac 


gatttcatcg 


tacaagctag 


acttgacaat 


tttaggtctg 


6900 


gccgctgagt 


gggttttggc 


atatatgttg 


ttcacaaaat 


tcttttattt 


attaggtctt 


6960 


tcagctataa 


tgcaggtgtt 


ctttggctat 


tttgctagtc 


atttcatcag 


caattcttgg 


7020 


ctcatgtggt 


ttatcattag 


tattgtacaa 


atggcacccg 


tttctgcaat 


ggttaggatg 


7080 
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tacatcttct 


ttgcttcttt 


ctactacata tggaagagct atgttcatat 


catggatggt 


7140 


tgcacctctt 


cgacttgcat 


gatgtgctat 


aagcgcaatc gtgccacacg 


cgttgagtgt 


7200 


acaactattg 


ttaatggcat 


gaagagatct 


ttctatgtct 


atgcaaatgg 


aggccgtggc 


7260 


ttctgcaaga ctcacaattg gaattgtctc aattgtgaca cattttgcac tggtagtaca 


7320 


ttcattagtg 


atgaagttgc tcgtgatttg 


tcactccagt 


ttaaaagacc 


aatcaaccct 


7380 


actgaccagt 


catcgtatat 


tgttgatagt 


gttgctgtga aaaatggcgc gcttcacctc 


7440 


tactttgaca aggctggtca aaagacctat gagagacatc 


cgctctccca ttttgtcaat 


7500 


ttagacaatt tgagagctaa caacactaaa ggttcactgc ctattaatgt 


cataguttt l 


7560 


natnnraant 

yaLggt-adgT. 


ccaaatgcga cgagtctgct tctaagtctg cttctgtgta 


c tacag iicag 


7620 


ctgaLg ugcc 


aacctattct 


gttgcttgac 


caagctcttg 


tatcagacgt 


tggagatagt 


7680 


ac Lgaag l l l 


ccgttaagat 


gtttgatgct 


tatgtcgaca 


ccttttcagc 


aac l l Lxag l 


7740 




aaaaacttaa ggcacttgtt 


gctacagctc 


acagcgagtt 


agcaaagggt 


7800 


g Lagci- Ltcig 


atggtgtcct 


ttctacattc 


gtgtcagctg 


cccgacaagg 


LgT.xgi.ugaL 


7860 


accgatgttg 


acacaaagga tgttattgaa tgtctcaaac tttcacatca 


cxCugaciixa 


7920 


gaagtgacag 


gtgacagttg 


taacaatttc 


atgctcacct 


ataataaggt 


tgaaaacatg 


7980 


acgcccagag 


atcttggcgc 


atgtattgac 


tgtaatgcaa 


ggcatatcaa 


tgcccaagta 


8040 


gcaaaaagtc 


acaatgtttc 


actcatctgg 


aatgtaaaag 


actacatgtc 


tttatctgaa 


8100 


cagctgcgta 


aacaaattcg 


tagtgctgcc 


aagaagaaca 


acataccttt 


tagactaact 


8160 


tgtgctacaa 


ctagacaggt 


tgtcaatgtc 


ataactacta 


aaatctcact 


caagggtggt 


8220 


aagattgtta 


gtacttgttt 


taaacttatg 


cttaaggcca 


cattattgtg 


cgttcttgct 


8280 


gcattggttt 


gttatatcgt 


tatgccagta 


catacattgt 


caatccatga 


tggttacaca 


8340 


aatgaaatca 


ttggttacaa 


agccattcag 


gatggtgtca 


ctcgtgacat 


catttctact 


8400 


gatgattgtt 


ttgcaaataa 


acatgctggt 


tttgacgcat 


ggtttagcca 


gcgtggtggt 


8460 


tcatacaaaa 


atgacaaaag 


ctgccctgta 


gtagctgcta 


tcattacaag 


agagattggt 


8520 


ttcatagtgc 


ctggcttacc 


gggtactgtg 


ctgagagcaa 


tcaatggtga 


cttcttgcat 


8580 


tttctacctc gtgtttttag tgctgttggc aacatttgct acacaccttc caaactcatt 


8640 


gagtatagtg 


attttgctac 


ctctgcttgc 


gttcttgctg 


ctgagtgtac 


aatttttaag 


8700 


gatgctatgg 


gcaaacctgt 


gccatattgt 


tatgacacta 


atttgctaga 


gggttctatt 


8760 


tcttatagtg 


agcttcgtcc agacactcgt 


tatgtgctta tggatggttc 


catcatacag 


8820 


tttcctaaca 


cttacctgga gggttctgtt 


agagtagtaa 


caacttttga 


tgctgagtac 


8880 


tgtagacatg 


gtacatgcga 


aaggtcagaa gtaggtattt 


gcctatctac 


cagtggtaga 


8940 


tgggttctta ataatgagca ttacagagct 


ctatcaggag 


ttttctgtgg 


tgttgatgcg 


9000 


atgaatctca 


tagctaacat 


ctttactcct 


cttgtgcaac 


ctgtgggtgc 


tttagatgtg 


9060 


tctgcttcag 


tagtggctgg tggtattatt gccatattgg 


tgacttgtgc 


tgcctactac 


9120 
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tttatgaaat tcagacgtgt ttttggtgag tacaaccatg ttgttgctgc taatgcactt 9180 

ttgtttttga tgtctttcac tatactctgt ctggtaccag cttacagctt tctgccggga 9240 

gtctactcag tcttttactt gtacttgaca ttctatttca ccaatgatgt ttcattcttg 9300 

gctcaccttc aatggtttgc catgttttct cctattgtgc ctttttggat aacagcaatc 9360 

tatgtattct gtatttctct gaagcactgc cattggttct ttaacaacta tcttaggaaa 9420 

agagtcatgt ttaatggagt tacatttagt accttcgagg aggctgcttt gtgtaccttt 9480 

ttgctcaaca aggaaatgta cctaaaattg cgtagcgaga cactgttgcc acttacacag 9540 

tataacaggt atcttgctct atataacaag tacaagtatt tcagtggagc cttagatact 9600 

accagctatc gtgaagcagc ttgctgccac ttagcaaagg ctctaaatga ctttagcaac 9660 

tcaggtgctg atgttctcta ccaaccacca cagacatcaa tcacttctgc tgttctgcag 9720 

agtggtttta ggaaaatggc attcccgtca ggcaaagttg aagggtgcat ggtacaagta 9780 

acctgtggaa ctacaactct taatggattg tggttggatg acacagtata ctgtccaaga 9840 

catgtcattt gcacagcaga agacatgctt aatcctaact atgaagatct gctcattcgc 9900 

aaatccaacc atagctttct tgttcaggct ggcaatgttc aacttcgtgt tattggccat 9960 

tctatgcaaa attgtctgct taggcttaaa gttgatactt ctaaccctaa gacacccaag 10020 

tataaatttg tccgtatcca acctggtcaa acattttcag ttctagcatg ctacaatggt 10080 

tcaccatctg gtgtttatca gtgtgccatg agacctaatc ataccattaa aggttctttc 10140 

cttaatggat catgtggtag tgttggtttt aacattgatt atgattgcgt gtctttctgc 10200 

tatatgcatc atatggagct tccaacagga gtacacgctg gtactgactt agaaggtaaa 10260 

ttctatggtc catttgttga cagacaaact gcacaggctg caggtacaga cacaaccata 10320 

acattaaatg ttttggcatg gctgtatgct gctgttatca atggtgatag gtggtttctt 10380 

aatagattca ccactacttt gaatgacttt aaccttgtgg caatgaagta caactatgaa 10440 

cctttgacac aagatcatgt tgacatattg ggacctcttt ctgctcaaac aggaattgcc 10500 

gtcttagata tgtgtgctgc tttgaaagag ctgctgcaga atggtatgaa tggtcgtact 10560 

atccttggta gcactatttt agaagatgag tttacaccat ttgatgttgt tagacaatgc 10620 

tctggtgtta ccttccaagg taagttcaag aaaattgtta agggcactca tcattggatg 10680 

cttttaactt tcttgacatc actattgatt cttgttcaaa gtacacagtg gtcactgttt 10740 

ttctttgttt acgagaatgc tttcttgcca tttactcttg gtattatggc aattgctgca 10800 

tgtgctatgc tgcttgttaa gcataagcac gcattcttgt gcttgtttct gttaccttct 10860 

cttgcaacag ttgcttactt taatatggtc tacatgcctg ctagctgggt gatgcgtatc 10920 

atgacatggc ttgaattggc tgacactagc ttgtctggtt ataggcttaa ggattgtgtt 10980 

atgtatgctt cagctttagt tttgcttatt ctcatgacag ctcgcactgt ttatgatgat 11040 

gctgctagac gtgtttggac actgatgaat gtcattacac ttgtttacaa agtctactat 11100 

ggtaatgctt tagatcaagc tatttccatg tgggccttag ttatttctgt aacctctaac 11160 
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tattctggtg tcgttacgac tatcatgttt ttagctagag ctatagtgtt tgtgtgtgtt 11220 

gagtattacc cattgttatt tattactggc aacaccttac agtgtatcat gcttgtttat 11280 

tgtttcttag gctattgttg ctgctgctac tttggccttt tctgtttact caaccgttac 11340 

ttcaggctta ctcttggtgt ttatgactac ttggtctcta cacaagaatt taggtatatg 11400 

aactcccagg ggcttttgcc tcctaagagt agtattgatg ctttcaagct taacattaag 11460 

ttgttgggta ttggaggtaa accatgtatc aaggttgcta ctgtacagtc taaaatgtct 11520 

gacgtaaagt gcacatctgt ggtactgctc tcggttcttc aacaacttag agtagagtca 11580 

tcttctaaat tgtgggcaca atgtgtacaa ctccacaatg atattcttct tgcaaaagac 11640 

acaactgaag ctttcgagaa gatggtttct cttttgtctg ttttgctatc catgcagggt 11700 

gctgtagaca ttaataggtt gtgcgaggaa atgctcgata accgtgctac tcttcaggct 11760 

attgcttcag aatttagttc tttaccatca tatgccgctt atgccactgc ccaggaggcc 11820 

tatgagcagg ctgtagctaa tggtgattct gaagtcgttc tcaaaaagtt aaagaaatct 11880 

ttgaatgtgg ctaaatctga gtttgaccgt gatgctgcca tgcaacgcaa gttggaaaag 11940 

atggcagatc aggctatgac ccaaatgtac aaacaggcaa gatctgagga caagagggca 12000 

aaagtaacta gtgctatgca aacaatgctc ttcactatgc ttaggaagct tgataatgat 12060 

gcacttaaca acattatcaa caatgcgcgt gatggttgtg ttccactcaa catcatacca 12120 

ttgactacag cagccaaact catggttgtt gtccctgatt atggtaccta caagaacact 12180 

tgtgatggta acacctttac atatgcatct gcactctggg aaatccagca agttgttgat 12240 

gcggatagca agattgttca acttagtgaa attaacatgg acaattcacc aaatttggct 12300 

tggcctctta ttgttacagc tctaagagcc aactcagctg ttaaactaca gaataatgaa 12360 

ctgagtccag tagcactacg acagatgtcc tgtgcggctg gtaccacaca aacagcttgt 12420 

actgatgaca atgcacttgc ctactataac aattcgaagg gaggtaggtt tgtgctggca 12480 

ttactatcag accaccaaga tctcaaatgg gctagattcc ctaagagtga tggtacaggt 12540 

acaatttaca cagaactgga accaccttgt aggtttgtta cagacacacc aaaagggcct 12600 

aaagtgaaat acttgtactt catcaaaggc ttaaacaacc taaatagagg tatggtgctg 12660 

ggcagtttag ctgctacagt acgtcttcag gctggaaatg ctacagaagt acctgccaat 12720 

tcaactgtgc tttccttctg tgcttttgca gtagaccctg ctaaagcata taaggattac 12780 

ctagcaagtg gaggacaacc aatcaccaac tgtgtgaaga tgttgtgtac acacactggt 12840 

acaggacagg caattactgt aacaccagaa gctaacatgg accaagagtc ctttggtggt 12900 

gcttcatgtt gtctgtattg tagatgccac attgaccatc caaatcctaa aggattctgt 12960 

gacttgaaag gtaagtacgt ccaaatacct accacttgtg ctaatgaccc agtgggtttt 13020 

acacttagaa acacagtctg taccgtctgc ggaatgtgga aaggttatgg ctgtagttgt 13080 

gaccaactcc gcgaaccctt gatgcagtct gcggatgcat caacgttttt aaacgggttt 13140 

gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact gatgtcgtct 13200 
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acagggcttt tgatatttac aacgaaaaag 
attgctgtcg cttccaggag aaggatgagg 
ttaagaggca tactatgtct aactaccaac 
attgtccagc ggttgctgtc catgactttt 
cacatatatc acgtcagcgt ctaactaaat 
gtcattttga tgagggtaat tgtgatacat 
gtgatgatga ttatttcaat aagaaggatt 
tacgcgtata tgctaactta ggtgagcgtg 
tctgcgatgc tatgcgtgat gcaggcattg 
ttaatgggaa ctggtacgat ttcggtgatt 
ctattgtgga ttcatattac tcattgctga 
ctgctgagtc ccatatggat gctgatctcg 
aatatgattt tacggaagag agactttgtc 
agacatacca tcccaattgt attaactgtt 
actttaatgt gttattttct actgtgtttc 
aaatatttgt agatggtgtt ccttttgttg 
gagtcgtaca taatcaggat gtaaacttac 
tagtgtatgc tgctgatcca gctatgcatg 
gcactacatg cttttcagta gctgcactaa 
ccggtaattt taataaagac ttttatgact 
gaagttctgt tgaactaaaa cacttcttct 
attatgacta ttatcgttat aatctgccaa 
tagttgaagt tgttgataaa tactttgatt 
aagtaatcgt taacaatctg gataaatcag 
ctagacttta ttatgactca atgagttatg 
agcgtaatgt catccctact ataactcaaa 
atagagctcg caccgtagct ggtgtctcta 
atcagaaatt attgaagtca atagccgcca 
gcaagtttta cggtggctgg cataatatgt 
cacaccttat gggttgggat tatccaaaat 
taatggcctc tcttgttctt gctcgcaaac 
tctacaggtt agctaacgag tgtgcgcaag 
cactatatgt taaaccaggt ggaacatcat 
gtgtctttaa catttgtcaa gctgttacag 
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ttgctggttt tgcaaagttc 

aaggcaattt attagactct 

atgaagagac tatttataac 

tcaagtttag agtagatggt 

acacaatggc tgatttagtc 

taaaagaaat actcgtcaca 

ggtatgactt cgtagagaat 

tacgccaatc attattaaag 

taggcgtact gacattagat 

tcgtacaagt agcaccaggc 

tgcccatcct cactttgact 

caaaaccact tattaagtgg 

tcttcgaccg ttattttaaa 

tggatgatag gtgtatcctt 

cacctacaag ttttggacca 

tttcaactgg ataccatttt 

atagctcgcg tctcagtttc 

cagcttctgg caatttattg 

caaacaatgt tgcttttcaa 

ttgctgtgtc taaaggtttc 

ttgctcagga tggcaacgct 

caatgtgtga tatcagacaa 

gttacgatgg tggctgtatt 

ctggtttccc atttaataaa 

aggatcaaga tgcacttttc 

tgaatcttaa gtatgccatt 

tctgtagtac tatgacaaat 

ctagaggagc tactgtggta 

taaaaactgt ttacagtgat 

gtgacagagc catgcctaac 

ataacacttg ctgtaactta 

tattaagtga gatggtcatg 

ccggtgatgc tacaactgct 

ccaatgtaaa tgcacttctt 
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ctaaaaacta 

tactttgtag 

ttggttaaag 

gacatggtac 

tatgctctac 

tacaattgct 

cctgacatct 

actgtacaat 

aatcaggatc 

tgcggagttc 

agggcattgg 

gatttgctga 

tattgggacc 

cattgtgcaa 

ctagtaagaa 

cgtgagttag 

aaggaacttt 

ctagataaac 

actgtcaaac 

tttaaggaag 

gctatcagtg 

ctcctattcg 

aatgccaacc 

tggggtaagg 

gcgtatacta 

agtgcaaaga 

agacagtttc 

attggaacaa 

gtagaaactc 

atgcttagga 

tcacaccgtt 

tgtggcggct 

tatgctaata 

tcaactgatg 



13260 

13320 

13380 

13440 

13500 

13560 

13620 

13680 

13740 

13800 

13860 

13920 

13980 

14040 

14100 

14160 

14220 

14280 

14340 

14400 

14460 

14520 

14580 

14640 

14700 

14760 

14820 

14880 

14940 

15000 

15060. 

15120 

15180 

15240 
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gtaataagat agctgacaag tatgtccgca atctacaaca caggctctat gagtgtctct 15300 

atagaaatag ggatgttgat catgaattcg tggatgagtt ttacgcttac ctgcgtaaac 15360 

atttctccat gatgattctt tctgatgatg ccgttgtgtg ctataacagt aactatgcgg 15420 

ctcaaggttt agtagctagc attaagaact ttaaggcagt tctttattat caaaataatg 15480 

tgttcatgtc tgaggcaaaa tgttggactg agactgacct tactaaagga cctcacgaat 15540 

tttgctcaca gcatacaatg ctagttaaac aaggagatga ttacgtgtac ctgccttacc 15600 

cagatccatc aagaatatta ggcgcaggct gttttgtcga tgatattgtc aaaacagatg 15660 

gtacacttat gattgaaagg ttcgtgtcac tggctattga tgcttaccca cttacaaaac 15720 

atcctaatca ggagtatgct gatgtctttc acttgtattt acaatacatt agaaagttac 15780 

atgatgagct tactggccac atgttggaca tgtattccgt aatgctaact aatgataaca 15840 

cctcacggta ctgggaacct gagttttatg aggctatgta cacaccacat acagtcttgc 15900 

aggctgtagg tgcttgtgta ttgtgcaatt cacagacttc acttcgttgc ggtgcctgta 15960 

ttaggagacc attcctatgt tgcaagtgct gctatgacca tgtcatttca acatcacaca 16020 

aattagtgtt gtctgttaat ccctatgttt gcaatgcccc aggttgtgat gtcactgatg 16080 

tgacacaact gtatctagga ggtatgagct attattgcaa gtcacataag cctcccatta 16140 

gttttccatt atgtgctaat ggtcaggttt ttggtttata caaaaacaca tgtgtaggca 16200 

gtgacaatgt cactgacttc aatgcgatag caacatgtga ttggactaat gctggcgatt 16260 

acatacttgc caacacttgt actgagagac tcaagctttt cgcagcagaa acgctcaaag 16320 

ccactgagga aacatttaag ctgtcatatg gtattgccac tgtacgcgaa gtactctctg 16380 

acagagaatt gcatctttca tgggaggttg gaaaacctag accaccattg aacagaaact 16440 

atgtctttac tggttaccgt gtaactaaaa atagtaaagt acagattgga gagtacacct 16500 

ttgaaaaagg tgactatggt gatgctgttg tgtacagagg tactacgaca tacaagttga 16560 

atgttggtga ttactttgtg ttgacatctc acactgtaat gccacttagt gcacctactc 16620 

tagtgccaca agagcactat gtgagaatta ctggcttgta cccaacactc aacatctcag 16680 

atgagttttc tagcaatgtt gcaaattatc aaaaggtcgg catgcaaaag tactctacac 16740 

tccaaggacc acctggtact ggtaagagtc attttgccat cggacttgct ctctattacc 16800 

catctgctcg catagtgtat acggcatgct ctcatgcagc tgttgatgcc ctatgtgaaa 16860 

aggcattaaa atatttgccc atagataaat gtagtagaat catacctgcg cgtgcgcgcg 16920 

tagagtgttt tgataaattc aaagtgaatt caacactaga acagtatgtt ttctgcactg 16980 

taaatgcatt gccagaaaca actgctgaca ttgtagtctt tgatgaaatc tctatggcta 17040 

ctaattatga cttgagtgtt gtcaatgcta gacttcgtgc aaaacactac gtctatattg 17100 

gcgatcctgc tcaattacca gccccccgca cattgctgac taaaggcaca ctagaaccag 17160 

aatattttaa ttcagtgtgc agacttatga aaacaatagg tccagacatg ttccttggaa 17220 

cttgtcgccg ttgtcctgct gaaattgttg acactgtgag tgctttagtt tatgacaata 17280 
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agctaaaagc 


acacaaggat 


aagtcagctc 


aatgcttcaa 


aatgttctac 


aaaggtgtta 


17340 


ttacacatga 


tgtttcatct 


gcaatcaaca 


gacctcaaat 


aggcgttgta 


agagaatttc 


17400 


ttacacgcaa 


tcctgcttgg 


agaaaagctg 


tttttatctc 


accttataat 


tcacagaacg 


17460 


ctgtagcttc 


aaaaatctta 


ggattgccta 


cgcagactgt 


tgattcatca 


cagggttctg 


17520 


aatatgacta 


tgtcatattc 


acacaaacta 


ctgaaacagc 


acactcttgt 


aatgtcaacc 


17580 


gcttcaatgt 


ggctatcaca 


agggcaaaaa 


ttggcatttt 


gtgcataatg 


tctgatagag 


17640 


atctttatga 


caaactgcaa 


tttacaagtc 


tagaaatacc 


acgtcgcaat 


gtggctacat 


17700 


tacaagcaga 


aaatgtaact 


ggacttttta 


aggactgtag 


taagatcatt 


actggtcttc 


17760 


atcctacaca 


ggcacctaca 


cacctcagcg 


ttgatataaa 


gttcaagact 


gaaggattat 


17820 


gtgttgacat 


accaggcata 


ccaaaggaca 


tgacctaccg 


tagactcatc 


tctatgatgg 


17880 


gtttcaaaat 


gaattaccaa 


gtcaatggtt 


accctaatat 


grttatcacc 


cgcgaagaag 


17940 


ctattcgtca 


cgttcgtgcg 


tggattggct 


ttgatgtaga 


gggctgtcat 


gcaactagag 


18000 


atgctgtggg 


tactaaccta 


cctctccagc 


taggattttc 


tacaggtgtt 


aacttagtag 


18060 


ctgtaccgac 


tggttatgtt 


gacactgaaa 


ataacacaga 


attcaccaga 


gttaatgcaa 


18120 


aacctccacc 


aggtgaccag 


tttaaacatc 


ttataccact 


catgtataaa 


ggcttgccct 


18180 


ggaatgtagt 


gcgtattaag 


atagtacaaa 


tgctcagtga 


tacactgaaa 


ggattgtcag 


18240 


acagagtcgt 


gttcgtcctt 


tgggcgcatg 


gctttgagct 


tacatcaatg 


aagtactttg 


18300 


tcaagattgg 


acctgaaaga 


acgtgttgtc 


tgtgtgacaa 


acgtgcaact 


tgcttttcta 


18360 


cttcatcaga 


tacttatgcc 


tgctggaatc 


attctgtggg 


ttttgactat 


gtctataacc 


18420 


catttatgat 


tgatgttcag 


cagtggggct 


ttacgggtaa 


ccttcagagt 


aaccatgacc 


18480 


aacattgcca 


ggtacatgga 


aatgcacatg 


tggctagttg 


tgatgctatc 


atgactagat 


18540 


gtttagcagt 


ccatgagtgc 


tttgttaagc 


gcgttgattg 


gtctgttgaa 


taccctatta 


18600 


taggagatga 


actgagggtt 


aattctgctt 


gcagaaaagt 


acaacacatg 


gttgtgaagt 


18660 


ctgcattgct 


tgctgataag 


tttccagttc 


ttcatgacat 


tggaaatcca 


aaggctatca 


18720 


agtgtgtgcc 


tcaggctgaa 


gtagaatgga 


agttctacga 


tgctcagcca 


tgtagtgaca 


18780 


aagcttacaa 


aatagaggaa 


ctcttctatt 


cttatgctac 


acatcacgat 


aaattcactg 


18840 


atggtgtttg 


tttgttttgg 


aattgtaacg 


ttgatcgtta 


cccagccaat 


gcaattgtgt 


18900 


gtaggtttga 


cacaagagtc 


ttgtcaaact 


tgaacttacc 


aggctgtgat 


ggtggtagtt 


18960 


tgtatgtgaa 


taagcatgca 


ttccacactc 


cagctttcga 


taaaagtgca 


tttactaatt 


19020 


taaagcaatt 


gcctttcttt 


tactattctg 


atagtccttg 


tgagtctcat 


ggcaaacaag 


19080 


tagtgtcgga 


tattgattat 


gttccactca 


aatctgctac 


gtgtattaca 


cgatgcaatt 


19140 


taggtggtgc 


tgtttgcaga 


caccatgcaa 


atgagtaccg 


acagtacttg 


gatgcatata 


19200 


atatgatgat 


ttctgctgga 


tttagcctat 


ggatttacaa 


acaatttgat 


acttataacc 


19260 


tgtggaatac 


atttaccagg 


ttacagagtt 


tagaaaatgt 


ggcttataat 


gttgttaata 


19320 
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aaggacactt tgatggacac gccggcgaag 


cacctgtttc 


catcattaat 


aatgctgttt 


19380 


acacaaaggt agatggtatt gatgtggaga tctttgaaaa taagacaaca cttcctgtta 


19440 


atgttgcatt 


tgagctttgg 


gctaagcgta 


acattaaacc 


agtgccagag 


attaagatac 


19500 


tcaataattt 


gggtgttgat 


atcgctgcta 


atactgtaat 


ctgggactac 


aaaagagaag 


19560 


ccccagcaca 


tgtatctaca 


ataggtgtct 


gcacaatgac tgacattgcc 


aagaaaccta 


19620 


ctgagagtgc 


ttgttcttca 


cttactgtct 


tgtttgatgg 


tagagtggaa ggacaggtag 


19680 


acctttttag 


aaacgcccgt 


aatggtgttt 


taataacaga 


aggttcagtc 


aaaggtctaa 


19740 


caccttcaaa 


gggaccagca 


caagctagcg 


tcaatggagt 


cacattaatt 


ggagaatcag 


19800 


taaaaacaca 


gtttaactac 


tttaagaaag 


tagacggcat 


tattcaacag 


ttgcctgaaa 


19860 


cctactttac 


tcagagcaga 


gacttagagg 


attttaagcc 


cagatcacaa 


atggaaactg 


19920 


actttctcga gctcgctatg 


gatgaattca tacagcgata taagctcgag 


ggctatgcct 


19980 


tcgaacacat 


cgtttatgga 


gatttcagtc 


atggacaact 


tggcggtctt 


catttaatga 


20040 


taggcttagc 


caagcgctca 


caagattcac 


cacttaaatt 


agaggatttt 


atccctatgg 


20100 


acagcacagt 


gaaaaattac 


ttcataacag 


atgcgcaaac 


aggttcatca 


aaatgtgtgt 


20160 


gttctgtgat 


tgatctttta 


cttgatgact 


ttgtcgagat 


aataaagtca 


caagatttgt 


20220 


cagtgatttc 


aaaagtggtc 


aaggttacaa 


ttgactatgc 


tgaaatttca 


ttcatgcttt 


20280 


ggtgtaagga 


tggacatgtt 


gaaaccttct 


acccaaaact 


acaagcaagt 


caagcgtggc 


20340 


aaccaggtgt 


tgcgatgcct 


aacttgtaca 


agatgcaaag 


aatgcttctt 


gaaaagtgtg 


20400 


accttcagaa 


ttatggtgaa 


aatgctgtta 


taccaaaagg 


aataatgatg 


aatgtcgcaa 


20460 


agtatactca 


actgtgtcaa 


tacttaaata 


cacttacttt 


agctgtaccc 


tacaacatga 


20520 


gagttattca 


ctttggtgct 


ggctctgata 


aaggagttgc 


accaggtaca 


gctgtgctca 


20580 


gacaatggtt 


gccaactggc 


acactacttg 


tcgattcaga tcttaatgac 


ttcgtctccg 


20640 


acgcagattc 


tactttaatt 


ggagactgtg 


caacagtaca tacggctaat 


aaatgggacc 


20700 


ttattattag 


cgatatgtat 


gaccctagga 


ccaaacatgt 


gacaaaagag 


aatgactcta 


20760 


aagaagggtt 


tttcacttat 


ctgtgtggat ttataaagca aaaactagcc ctgggtggtt 


20820 


ctatagctgt aaagataaca gagcattctt ggaatgctga cctttacaag cttatgggcc 


20880 


atttctcatg gtggacagct 


tttgttacaa atgtaaatgc atcatcatcg 


gaagcatttt 


20940 


taattggggc taactatctt 


ggcaagccga 


aggaacaaat 


tgatggctat 


accatgcatg 


21000 


ctaactacat 


tttctggagg 


aacacaaatc 


ctatccagtt 


gtcttcctat 


tcactctttg 


21060 


acatgagcaa 


atttcctctt 


aaattaagag 


gaactgctgt 


aatgtctctt 


aaggagaatc 


21120 


aaatcaatga tatgatttat 


tctcttctgg 


aaaaaggtag 


gcttatcatt 


agagaaaaca 


21180 


acagagttgt ggtttcaagt 


gatattcttg 


ttaacaacta 


a 




21221 



<210> 32 
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<211> 297 
<212> DNA 
<213> CORONAVIRUS 



<400> 32 ^ an 

atggacccca atcaaaccaa cgtagtgccc cccgcattac atttggtgga cccacagatt 60 

caactgacaa taaccagaat ggaggacgca atggggcaag gccaaaacag cgccgacccc 120 

aaggtttacc caataatact gcgtcttggt tcacagctct cactcagcat ggcaaggagg 180 

aacttagatt ccctcgaggc cagggcgttc caatcaacac caatagtggt ccagatgacc 240 

aaattggcta ctaccgaaga gctacccgac gagttcgtgg tggtgacggc aaaatga 297 

<210> 33 

<2U> 98 

<212> PRT 

<213> CORONAVIRUS 



<400> 33 

Met Asp Pro Asn Gin Thr Asn Val Val Pro Pro Ala Leu His Leu Val 
15 .10 15 

Asp Pro Gin lie Gin Leu Thr lie Thr Arg Met Glu Asp Ala Met Gly 
20 25 30 

Gin Gly Gin Asn ser Ala Asp Pro Lys Val Tyr Pro lie lie Leu Arg 
35 40 45 

Leu Gly Ser Gin Leu Ser Leu ser Met Ala Arg Arg Asn Leu Asp Ser 
50 55 60 

Leu Glu Ala Arg Ala Phe Gin ser Thr Pro lie val Val Gin Met Thr 
65 70 75 80 

Lys Leu Ala Thr Thr Glu Glu Leu Pro Asp Glu Phe val Val val Thr 
85 90 95 

Ala Lys 



<210> 34 

<211> 213 

<212> DNA 

<213> CORONAVIRUS 
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<400> 34 

atgctgccac cgtgctacaa cttcctcaag gaacaacatt gccaaaaggc ttctacgcag 60 

agggaagcag aggcggcagt caagcctctt ctcgctcctc atcacgtagt cgcggtaatt 120 

caagaaattc aactcctggc agcagtaggg gaaattctcc tgctcgaatg gctagcggag 180 

gtggtgaaac tgccctcgcg ctattgctgc tag 213 

<210> 35 

<211> 70 

<212> PRT 

<213> CORONAVIRUS 

<400> 35 

Met Leu Pro Pro cys Tyr Asn Phe Leu Lys Glu Gin His Cys Gin Lys 
15 10 15 

Ala Ser Thr Gin Arg Glu Ala Glu Ala Ala Val Lys Pro Leu Leu Ala 
20 ~ 25 30 

Pro His His Val val Ala Val lie Gin Glu lie Gin Leu Leu Ala Ala 
35 40 45 

val Gly Glu lie Leu Leu Leu Glu Trp Leu Ala Glu Val val Lys Leu 
50 55 60 

Pro ser Arg Tyr Cys Cys 
65 70 

<210> 36 

<211> 1377 

<212> DNA 

<213> CORONAVIRUS 



<220> 

<221> CDS 

<222> (67). .(1335) 

<223> 



<400> 36 

atgaaggtca ccaaactgct gcatttagag acgtacttgt tgttttaaat aaacgaacaa 60 

attaaa atg tct gat aat gga ccc caa tea aac caa cgt agt gec ccc 108 
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Met ser Asp Asn Gly Pro Gin Ser Asn Gin Arg Ser Ala Pro 
15 10 



cgc att aca ttt ggt gga ccc aca gat tea act gac aat aac cag aat 
Arq lie Thr Phe Gly Gly Pro Thr Asp ser Thr Asp Asn Asn Gin Asn 
15 20 25 30 

gga gga cgc aat ggg gca agg cca aaa cag cgc cga ccc caa ggt tta 
Gly Gly Arg Asn Gly Ala Arg Pro Lys Gin Arg Arg Pro Gin Gly Leu 
35 40 45 

ccc aat aat act gcg tct tgg ttc aca get etc act cag cat ggc aag 
pro Asn Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gin His Gly Lys 
50 55 60 

gag gaa ctt aga ttc cct cga ggc cag ggc gtt cca ate aac ace aat 
Glu Glu Leu Arg Phe Pro Arg Gly Gin Gly val Pro lie Asn Thr Asn 
65 70 75 

agt ggt cca gat gac caa att ggc tac tac cga aga get acc cga cga 
ser Gly Pro Asp Asp Gin lie Gly Tyr Tyr Arg Arg Ala Thr Arg Arg 
80 85 90 

gtt cgt ggt ggt gac ggc aaa atg aaa gag etc age ccc aga tgg tac 
Val Arg Gly Gly Asp Gly Lys Met Lys Glu Leu Ser Pro Arg Trp Tyr 
95 100 105 110 

ttc tat tac eta gga act ggc cca gaa get tea ctt ccc tac ggc get 
Phe Tyr Tyr Leu Gly Thr Gly Pro Glu Ala ser Leu Pro Tyr Gly Ala 
115. 120 125 

aac aaa gaa ggc ate gta tgg gtt gca act gag gga gee ttg aat aca 
Asn Lys Glu Gly lie Val Trp Val Ala Thr Glu Gly Ala Leu Asn Thr 
130 135 140 

ccc aaa gac cac att ggc acc cgc aat cct aat aac aat get gee acc 
Pro Lys Asp His lie Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr 
145 150 155 

gtg eta- caa ctt cct caa gga aca aca ttg cca aaa ggc ttc tac gca 
val Leu Gin Leu Pro Gin Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala 
160 165 170 

gag gga age aga ggc ggc agt caa gee tct tct cgc tec tea tea cgt 
Glu Gly Ser Arg Gly Gly Ser Gin Ala Ser ser Arg ser Ser Ser Arg 
175 180 185 190 

agt cgc ggt aat tea aga aat tea act cct ggc age agt agg gga aat 
Ser Arg Gly Asn ser Arg Asn Ser Thr Pro Gly ser ser Arg Gly Asn 
195 200 205 

tct cct get cga atg get age gga ggt ggt gaa act gee etc gcg eta 
ser Pro Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu 
210 215 220 

ttg ctg eta gac aga ttg aac cag ctt gag age aaa gtt tct ggt aaa 
Leu Leu Leu Asp Arg Leu Asn Gin Leu Glu Ser Lys val ser Gly Lys 
225 230 235 



156 



204 



252 



300 



348 



396 



444 



492 



540 



588 



636 



684 



732 



780 



ggc caa caa caa caa ggc caa act gtc act aag aaa tct get get gag 828 

Gly Gin Gin Gin Gin Gly Gin Thr Val Thr Lys Lys Ser Ala Ala Glu 
240 245 250 

gca tct aaa aag cct cgc caa aaa cgt act gee aca aaa cag tac aac 876 

Ala ser Lys Lys Pro Arg Gin Lys Arg Thr Ala Thr Lys Gin Tyr Asn 

255 260 265 270 

gtc act caa gca ttt ggg aga cgt ggt cca gaa caa acc caa gga aat 924 
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Val Thr Gin Ala Phe Gly Arg Arg Gly Pro Glu Gin Thr Gin Gly Asn 
275 280 285 

ttc ggg gac caa gac eta ate aga caa gga act gat tac aaa cat tgg 972 
ly Asp Gin Asp Leu lie Arg Gin G\\ 



Phe Gly Asp Gin Asp Leu lie Arg Gin Gly Thr Asp Tyr Lys His Trp 
290 295 300 

ccg caa att gca caa ttt get cca agt gec tct gca ttc ttt gga atg 
pro Gin lie Ala Gin Phe Ala Pro ser Ala ser Ala Phe Phe Gly Met 
305 310 315 

tea cgc att gqc atg gaa gtc aca cct teg gga aca tgg ctg act tat 
ser Arg lie Gly Met Glu val Thr Pro ser Gly Thr Trp Leu Thr Tyr 
320 325 330 



get gac atg gat gat ttc tec aga caa ctt caa aat tec atg agt gga 
Ala Asp Met Asp Asp Phe ser Arg Gin Leu Gin Asn Ser Met Ser Gly 
400 405 410 



1020 



1068 



cat gga gee att aaa ttg gat gac aaa gat cca caa ttc aaa gac aac 1116 

His Gly Ala lie Lys Leu Asp Asp Lys Asp Pro Gin Phe Lys Asp Asn 
335 340 345 350 

gtc ata ctg ctg aac aag cac att gac gca tac aaa aca ttc cca cca 1164 

Val lie Leu Leu Asn Lys His lie Asp Ala Tyr Lys Thr Phe Pro Pro 
355 360 365 



aca gag cct aaa aag gac aaa aag aaa aag act gat gaa get cag cct 1212 
Thr Glu Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gin Pro 
370 375 380 



ttg ccg cag aga caa aag aag cag ccc act gtg act ctt ctt cct gcg 1260 
Leu Pro Gin Arg Gin Lys Lys Gin Pro Thr Val Thr Leu Leu Pro Ala 
385 390 395 



1308 



get tct get gat tea act cag gca taa acactcatga tgaccacaca 1355 
Ala Ser Ala Asp ser Thr Gin Ala 
415 420 

aggcagatgg gctatgtaaa eg 1377 

<210> 37 

<211> 422 

<212> PRT 

<213> CORONAVIRUS 



<400> 37 

Met ser Asp Asn Gly Pro Gin ser Asn Gin Arg ser Ala Pro Arg lie 
15 10 15 

Thr Phe Gly Gly Pro Thr Asp Ser Thr Asp Asn Asn Gin Asn Gly Gly 
20 25 30 

Arg Asn Gly Ala Arg Pro Lys Gin Arg Arg Pro Gin Gly Leu Pro Asn 
35 40 45 

Asn Thr Ala ser Trp Phe Thr Ala Leu Thr Gin His Gly Lys Glu Glu 
50 55 60 
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Leu Arg Phe Pro Arg Gly Gin Gly Val Pro lie Asn Thr Asn ser Gly 

65 70 75 80 

Pro Asp Asp Gin lie Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Val Arg 
85 90 95 

Gly Gly Asp Gly Lys Met Lys Glu Leu Ser Pro Arg Trp Tyr Phe Tyr 
100 105 ~ 110 

Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala Asn Lys 
115 120 125 

Glu Gly lie val Trp val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys 
130 135 140 

Asp His lie Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr Val Leu 
145 150 155 160 

Gin Leu Pro Gin Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly 
165 170 175 

ser Arg Gly Gly ser Gin Ala Ser ser Arg Ser ser Ser Arg ser Arg 
180 185 " 190 

Gly Asn ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Asn Ser Pro 
195 200 205 

Ala Arg Met Ala ser Gly Gly Gly Glu Thr Ala Leu Ala Leu Leu Leu 
210 215 220 

Leu Asp Arg Leu Asn Gin Leu Glu ser Lys Val Ser Gly Lys Gly Gin 
225 230 235 240 

Gin Gin Gin Gly Gin Thr Val Thr Lys Lys Ser Ala Ala Glu Ala ser 
245 250 255 

Lys Lys Pro Arg Gin Lys Arg Thr Ala Thr Lys Gin Tyr Asn val Thr 
260 265 270 

Gin Ala Phe Gly Arg Arg Gly Pro Glu Gin Thr Gin Gly Asn Phe Gly 
275 280 285 

Asp Gin Asp Leu lie Arg Gin Gly Thr Asp Tyr Lys His Trp Pro Gin 
290 295 300 

lie Ala Gin Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg 
305 310 315 320 

lie Gly Met Glu Val Thr Pro ser Gly Thr Trp Leu Thr Tyr His Gly 
325 330 335 
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Ala lie Lys Leu Asp Asp Lys Asp Pro Gin Phe Lys Asp Asn Val lie 
340 345 350 

Leu Leu Asn Lys His lie Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu 
355 360 365 

Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gin Pro Leu Pro 
370 375 380 

Gin Arg Gin Lys Lys Gin Pro Thr val Thr Leu Leu Pro Ala Ala Asp 
385 ~ 390 395 400 

Met Asp Asp Phe Ser Arg Gin Leu Gin Asn Ser Met Ser Gly Ala Ser 
405 410 415 

Ala Asp Ser Thr Gin Ala 
420 

<210> 38 

<211> 1377 

<212> DNA 

<213> CORONAVIRUS 



<400> 38 
atgaaggtca 


ccaaactgct 


gcatttagag 


acgtacttgt 


tgttttaaat 


aaacgaacaa 


60 


attaaaatgt 


ctgataatgg 


accccaatca 


aaccaacgta 


gtgccccccg 


cattacattt 


120 


ggtggaccca 


cagattcaac 


tgacaataac 


cagaatggag 


gacgcaatgg 


ggcaaggcca 


180 


aaacagcgcc 


gaccccaagg 


tttacccaat 


aatactgcgt 


cttggttcac 


agctctcact 


240 


cagcatggca 


aggaggaact 


tagattccct 


cgaggccagg 


gcgttccaat 


caacaccaat 


300 


agtggtccag 


atgaccaaat 


tggctactac 


cgaagagcta 


cccgacgagt 


tcgtggtggt 


360 


gacggcaaaa 


tgaaagagct 


cagccccaga 


tggtacttct 


attacctagg 


aactggccca 


420 


gaagcttcac 


ttccctacgg 


cgctaacaaa 


gaaggcatcg 


tatgggttgc 


aactgaggga 


480 


gccttgaata 


cacccaaaga 


ccacattggc 


acccgcaatc 


ctaataacaa 


tgctgccacc 


540 


gtgctacaac 


ttcctcaagg 


aacaacattg 


ccaaaaggct 


tctacgcaga 


gggaagcaga 


600 


ggcggcagtc 


aagcctcttc 


tcgctcctca 


tcacgtagtc 


gcggtaattc 


aagaaattca 


660 


actcctggca 


gcagtagggg 


aaattctcct 


gctcgaatgg 


ctagcggagg 


tggtgaaact 


720 


gccctcgcgc 


tattgctgct 


agacagattg 


aaccagcttg 


agagcaaagt 


ttctggtaaa 


780 


ggccaacaac 


aacaaggcca 


aactgtcact 


aagaaatctg 


ctgctgaggc 


atctaaaaag 


840 


cctcgccaaa 


aacgtactgc 


cacaaaacag 


tacaacgtca 


ctcaagcatt 


tgggagacgt 


900 


ggtccagaac 


aaacccaagg 


aaatttcggg 


gaccaagacc 
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tacaaacatt ggccgcaaat tgcacaattt gctccaagtg cctctgcatt ctttggaatg 1020 

tcacgcattg gcatggaagt cacaccttcg ggaacatggc tgacttatca tggagccatt 1080 

aaattggatg acaaagatcc acaattcaaa gacaacgtca tactgctgaa caagcacatt 1140 

gacgcataca aaacattccc accaacagag cctaaaaagg acaaaaagaa aaagactgat 1200 

gaagctcagc ctttgccgca gagacaaaag aagcagccca ctgtgactct tcttcctgcg 1260 

gctgacatgg atgatttctc cagacaactt caaaattcca tgagtggagc ttctgctgat 1320 

tcaactcagg cataaacact catgatgacc acacaaggca gatgggctat gtaaacg 1377 

<210> 39 

<211> 204 

<212> DNA 

<213> CORONAVIRUS 



<400> 39 

atattaggtt tttacctacc caggaaaagc caaccaacct cgatctcttg tagatctgtt 60 

ctctaaacga actttaaaat ctgtgtagct gtcgctcggc tgcatgccta gtgcacctac 120 

gcagtataaa caataataaa ttttactgtc gttgacaaga aacgagtaac tcgtccctct 180 

tctgcagact gcttacggtt tcgt 204 

<210> 40 

<211> 809 

<212> DNA 

<213> CORONAVIRUS 



<400> 40 
actcaagcat 


ttgggagacg 


tggtccagaa 


caaacccaag 


gaaatttcgg 


ggaccaagac 


60 


ctaatcagac 


aaggaactga 


ttacaaacat 


tggccgcaaa ttgcacaatt 


tgctccaagt 


120 


gcctctgcat 


tctttggaat 


gtcacgcatt 


ggcatggaag 


tcacaccttc 


gggaacatgg 


180 


ctgacttatc 


atggagccat 


taaattggat 


gacaaagatc 


cacaattcaa 


agacaacgtc 


240 


atactgctga 


acaagcacat 


tgacgcatac 


aaaacattcc 


caccaacaga 


gcctaaaaag 


300 


gacaaaaaga 


aaaagactga 


tgaagctcag 


cctttgccgc 


agagacaaaa 


gaagcagccc 


360 


actgtgactc 


ttcttcctgc 


ggctgacatg 


gatgatttct 


ccagacaact 


tcaaaattcc 


420 


atgagtggag 


cttctgctga 


ttcaactcag 


gcataaacac 


tcatgatgac 


cacacaaggc 


480 


agatgggcta 


tgtaaacgtt 


ttcgcaattc 


cgtttacgat 


acatagtcta 


ctcttgtgca 


540 


gaatgaattc 


tcgtaactaa 


acagcacaag 


taggtttagt 


taactttaat 


ctcacatagc 


600 


aatctttaat 


caatgtgtaa 


cattagggag 


gacttgaaag 


agccaccaca 


ttttcatcga 


660 
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aagagcccta atgtgtaaaa ttaattttag 
tcttaggaga atgacaaaaa aaaaaaaaa 

<210> 41 

<211> 448 

<212> DNA 

<213> CORONAVIRUS 



S226CAS108.ST25 

gaataatgct agggagagct gcctatatgg 720 
tagtgctatc cccatgtgat tttaatagct 780 

809 



<400> 41 

aatgaacaca tagggctgtt caagctgggg cagtacgcct ttttccagct ctactagacc 60 

acaagtgcca tttttgaggt gttcacgtgc ctccgatagg gcctcttcca cagagtcccc 120 

gaagccacgc actagcacgt ctctaacctg aaggacaggc aaactgagtt ggacgtgtgt 180 

tttctcgttg acaccaagaa caaggctctc catcttacct ttcggtcaca cccggacgaa 240 

acctaggtat gctgatgatc gactgcaaca cggacgaaac cgtaagcagt ctgcagaaga 300 

gggacgagtt actcgtttct tgtcaacgac agtaaaattt attattgttt atactgcgta 360 

ggtgcactag gcatgcagcc gagcgacagc tacacagatt ttaaagttcg tttagagaac 420 

agatctacaa gagatcgagg ttggttgg 448 

<210> 42 

<211> 2033 

<212> DNA 

<213> CORONAVIRUS 



<400> 42 

atacctaggt ttcgtccggg tgtgaccgaa aggtaagatg gagagccttg ttcttggtgt 60 

caacgagaaa acacacgtcc aactcagttt gcctgtcctt caggttagag acgtgctagt 120 

gcgtggcttc ggggactctg tggaagaggc cctatcggag gcacgtgaac acctcaaaaa 180 

tggcacttgt ggtctagtag agctggaaaa aggcgtactg ccccagcttg aacagcccta 240 

tgtgttcatt aaacgttctg atgccttaag caccaatcac ggccacaagg tcgttgagct 300 

ggttgcagaa atggacggca ttcagtacgg tcgtagcggt ataacactgg gagtactcgt 360 

gccacatgtg ggcgaaaccc caattgcata ccgcaatgtt cttcttcgta agaacggtaa 420 

taagggagcc ggtggtcata gctatggcat cgatctaaag tcttatgact taggtgacga 480 

gcttggcact gatcccattg aagattatga acaaaactgg aacactaagc atggcagtgg 540 

tgcactccgt gaactcactc gtgagctcaa tggaggtgca gtcactcgct atgtcgacaa 600 

caatttctgt ggcccagatg ggtaccctct tgattgcatc aaagattttc tcgcacgcgc 660 
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gggcaagtca atgtgcactc tttccgaaca acttgattac atcgagtcga agagaggtgt 720 

ctactgctgc cgtgaccatg agcatgaaat tgcctggttc actgagcgct ctgataagag 780 

ctacgagcac cagacaccct tcgaaattaa gagtgccaag aaatttgaca ctttcaaagg 840 

ggaatgccca aagtttgtgt ttcctcttaa ctcaaaagtc aaagtcattc aaccacgtgt 900 

tgaaaagaaa aagactgagg gtttcatggg gcgtatacgc tctgtgtacc ctgttgcatc 960 

tccacaggag tgtaacaata tgcacttgtc taccttgatg aaatgtaatc attgcgatga 1020 

agtttcatgg cagacgtgcg actttctgaa agccacttgt gaacattgtg gcactgaaaa 1080 

tttagttatt gaaggaccta ctacatgtgg gtacctacct actaatgctg tagtgaaaat 1140 

gccatgtcct gcctgtcaag acccagagat tggacctgag catagtgttg cagattatca 1200 

caaccactca aacattgaaa ctcgactccg caagggaggt aggactagat gttttggagg 1260 

ctgtgtgttt gcctatgttg gctgctataa taagcgtgcc tactgggttc ctcgtgctag 1320 

tgctgatatt ggctcaggcc atactggcat tactggtgac aatgtggaga ccttgaatga 1380 

ggatctcctt gagatactga gtcgtgaacg tgttaacatt aacattgttg gcgattttca 1440 

tttgaatgaa gaggttgcca tcattttggc atctttctct gcttctacaa gtgcctttat 1500 

tgacactata aagagtcttg attacaagtc tttcaaaacc attgttgagt cctgcggtaa 1560 

ctataaagtt accaagggaa agcccgtaaa aggtgcttgg aacattggac aacagagatc 1620 

agttttaaca ccactgtgtg gttttccctc acaggctgct ggtgttatca gatcaatttt 1680 

tgcgcgcaca cttgatgcag caaaccactc aattcctgat ttgcaaagag cagctgtcac 1740 

catacttgat ggtatttctg aacagtcatt acgtcttgtc gacgccatgg tttatacttc 1800 

agacctgctc accaacagtg tcattattat ggcatatgta actggtggtc ttgtacaaca 1860 

gacttctcag tggttgtcta atcttttggg cactactgtt gaaaaactca ggcctatctt 1920 

tgaatggatt gaggcgaaac ttagtgcagg agttgaattt ctcaaggatg cttgggagat 1980 

tctcaaattt ctcattacag gtgtttttga catcgtcaag ggtcaaatac agg 2033 

<210> 43 

<211> 2018 

<212> DNA 

<213> CORONAVIRUS 

<400> 43 

ggattgaggc gaaacttagt gcaggagttg aatttctcaa ggatgcttgg gagattctca 60 

aatttctcat tacaggtgtt tttgacatcg tcaagggtca aatacaggtt gcttcagata 120 

acatcaagga ttgtgtaaaa tgcttcattg atgttgttaa caaggcactc gaaatgtgca 180 

ttgatcaagt cactatcgct ggcgcaaagt tgcgatcact caacttaggt gaagtcttca 240 

tcgctcaaag caagggactt taccgtcagt gtatacgtgg caaggagcag ctgcaactac 300 
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tcatgcctct 


taaggcacca 


aaagaagtaa cctttcttga aggtgattca catgacacag 


360 


tacttacctc 


tgaggaggtt 


gttctcaaga acggtgaact cgaagcactc gagacgcccg 


420 


ttgatagctt 


cacaaatgga 


gctatcgttg gcacaccagt ctgtgtaaat ggcctcatgc 


480 


tcttagagat 


taaggacaaa 


gaacaatact gcgcattgtc tcctggttta 


ctggctacaa 


540 


acaatgtctt 


tcgcttaaaa 


gggggtgcac caattaaagg tgtaaccttt 


ggagaagata 


600 


ctgtttggga 


agttcaaggt 


tacaagaatg tgagaatcac atttgagctt gatgaacgtg 


660 


ttgacaaagt 


gcttaatgaa 


aagtgctctg tctacactgt tgaatccggt accgaagtta 


720 


ctgagtttgc 


atgtgttgta 


gcagaggctg ttgtgaagac tttacaacca 


gtttctgatc 


780 


tccttaccaa 


catgggtatt 


gatcttgatg agtggagtgt agctacattc tacttatttg 


840 


atgatgctgg 


tgaagaaaac 


ttttcatcac 


gtatgtattg 


ttccttttac 


cctccagatg 


900 


aggaagaaga 


ggacgatgca 


gagtgtgagg 


aagaagaaat 


tgatgaaacc 


tgtgaacatg 


960 


agtacggtac 


agaggatgat 


tatcaaggtc 


tccctctgga 


atttggtgcc 


tcagctgaaa 


1020 


cagttcgagt 


tgaggaagaa 


gaagaggaag 


actggctgga 


tgatactact 


gagcaatcag 


1080 


agattgagcc 


agaaccagaa 


cctacacctg 


aagaaccagt 


taatcagttt 


actggttatt 


1140 


taaaacttac 


tgacaatgtt 


gccattaaat 


gtgttgacat 


cgttaaggag 


gcacaaagtg 


1200 


ctaatcctat 


ggtgattgta 


aatgctgcta 


acatacacct 


gaaacatggt 


ggtggtgtag 


1260 


caggtgcact 


caacaaggca 


accaatggtg 


ccatgcaaaa 


ggagagtgat 


gattacatta 


1320 


agctaaatgg 


ccctcttaca 


gtaggagggt 


cttgtttgct 


ttctggacat 


aatcttgcta 


1380 


agaagtgtct 


gcatgttgtt 


ggacctaacc 


taaatgcagg 


tgaggacatc 


cagcttctta 


1440 


aggcagcata 


tgaaaatttc 


aattcacagg 


acatcttact 


tgcaccattg 


ttgtcagcag 


1500 


gcatatttgg 


tgctaaacca 


cttcagtctt 


tacaagtgtg 


cgtgcagacg 


gttcgtacac 


1560 


aggtttatat 


tgcagtcaat 


gacaaagctc tttatgagca ggttgtcatg 


gattatcttg 


1620 


ataacctgaa 


gcctagagtg 


gaagcaccta 


aacaagagga 


gccaccaaac 


acagaagatt 


1680 


ccaaaactga 


ggagaaatct 


gtcgtacaga 


agcctgtcga tgtgaagcca 


aaaattaagg 


1740 


cctgcattga 


tgaggttacc 


acaacactgg 


aagaaactaa 


gtttcttacc 


aataagttac 


1800 


tcttgtttgc 


tgatatcaat 


ggtaagcttt 


accatgattc 


tcagaacatg 


cttagaggtg 


1860 


aagatatgtc 


tttccttgag 


aaggatgcac 


cttacatggt 


aggtgatgtt 


atcactagtg 


1920 


gtgatatcac 


ttgtgttgta 


ataccctcca 


aaaaggctgg 


tggcactact 


gagatgctct 


1980 


caagagcttt 


gaagaaagtg 


ccagttgatg 


agtatata 






2018 



<210> 44 
<211> 1442 
<212> DNA 
<213> CORONAVIRUS 
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<400> 44 
ttaataaaat 


taccacaaca 


ctggaagaaa 


ctaagtttct taccaataag 


ttactcttgt 


60 


ttactaatat 


caataqtaaq 


ctttaccatg 


attctcagaa catgettaga 


ggtgaagata 


120 


tatctttcct 


taaaaaaqat 


gcaccttaca 


tqataaataa tattatcact 


agtgqtgata 


180 


"tea cut a tat 
lluv. ^ 57 27 


tataataccc 


tccaaaaagg 


ctaataacac tactqagatg 


ctctcaagag 


240 


ctttaaaaaa 


aataccaqtt 


qatqaqtata 


taaccacgta ccctggacaa 


ggatgtgctg 


300 


attatacact 


taaaaaaqct 


aagactgetc 


ttaagaaatg caaatctgea 


ttttatgtac 


360 


tacrttcaaa 


aacacctaat 


gctaaggaag 


agattctagg aactgtatcc 


tggaatttga 


420 


aaaaaatact 


tactcatact 


gaagagacaa 


gaaaattaat gectatatge 


atggatgtta 


480 


aaaccataat 


ggcaaccatc 


caaegtaagt 


ataaaggaat taaaattcaa 


gagggcatcg 


540 


ttaactataa 


tgtccgattc 


ttcttttata 


ctagtaaaga gectgtaget 


tctattatta 


600 


caaaactaaa 


ctctctaaat 


aaaccactta 

27 ** 27 w 27 w 27 


tcacaatgcc aattggttat 


gtgacacatg 


660 


attttaatct 


taaaaaaact 

k, 3 ww 3 u 33'" w 


acacactata 


tgcgttctct taaagctcct 


gccgtagtgt 


720 


caatatcatc 


accaaatact 


gttactacat 


ataatggata cctcacttcg 


tcatcaaaga 


780 


catctaaaaa 


gcactttgta 


gaaacagttt 


ctttggctgg ctcttacaga 


gattggtcct 


840 


attcaaaaca 


acatacaaaa 


ttaqqtqttq 


aatttcttaa gcgtggtgac 


aaaattgtgt 


900 


accacactct 


aaaaaacccc 

yyMyMyV»N«V>Vv 


gtcgagtttc 


atettgaegg tgaggttctt 


tcacttgaca 


960 


aactaaaaaa 


tctcttatcc 


ctacqqqaqq 


ttaagactat aaaagtgttc 


acaactgtgg 


1020 


acaacactaa 


tctccacaca 


caqcttqtqq 


atatgtctat gacatatgga 


cagcagtttg 


1080 


atccaacata 


cttaaataat 


gctgatgtta 


caaaaattaa acctcatgta 


aatcatgagg 


1140 


gtaagacttt 


ctttgtacta 


cctagtgatg 


acacactacg tagtgaagct 


ttcgagtact 


1200 


accatactct 


tgatgagagt 


tttcttggta 


ggtacatgtc tgctttaaac 


cacacaaaga 


1260 


aatggaaatt 


tcctcaagtt 


ggtggtttaa 


cttcaattaa atgggctgat 


aacaattgtt 


1320 


atttgtctag 


tgttttatta 


gcacttcaac 


agcttgaagt caaattcaat 


gcaccagcac 


1380 


ttcaagaggc 


ttattataga 


gcccgtgctg 


gtgatgctgc taacttttgt 


gcactcatac 


1440 


tc 










1442 


<210> 45 












<211> 1050 










<212> DNA 












<213> CORONAVIRUS 










<400> 45 

atatgtctat gacatatgga 


cagcagtttg 


gtccaacata cttggatggt 


gctgatgtta 


60 


caaaaattaa acctcatgta 


aatcatgagg 


gtaagacttt ctttgtacta 
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acacactacg 


tagtgaagct 


ttcgagtact 


accatactct 


tgatgagagt 


tttcttggta 


180 


ggtacatgtc 


tgctttaaac 


cacacaaaga 


aatggaaatt 


tcctcaagtt 


ggtggtttaa 


240 


cttcaattaa 


atgggctgat 


aacaattgtt 


atttgtctag 


tgttttatta 


gcacttcaac 


300 


agcttgaagt 


caaattcaat 


gcaccagcac 


ttcaagaggc 


ttattataga 


gcccgtgctg 


360 


gtgatgctgc 


taacttttgt 


gcactcatac 


tcgcttacag 


taataaaact 


gttggcgagc 


420 


ttggtgatgt 


cagagaaact 


atgacccatc 


ttctacagca 


tgctaatttg 


gaatctgcaa 


480 


agcgagttct 


taatgtggtg 


tgtaaacatt 


gtggtcagaa 


aactactacc 


ttaacgggtg 


540 


tagaagctgt 


gatgtatatg 


ggtactctat 


cttatgataa 


tcttaagaca 


ggtgtttcca 


600 


ttccatgtgt 


gtgtggtcgt 


gatgctacac 


aatatctagt 


acaacaagag 


tcttcttttg 


660 


ttatgatgtc 


tgcaccacct 


gctgagtata 


aattacagca 


aggtacattc 


ttatgtgcga 


720 


atgagtacac 


tggtaactat 


cagtgtggtc 


attacactca 


tataactgct 


aaggagaccc 


780 


"tctaticgta't 


tgacggagct 


r~ r~ +• +~ "5 "5 "5 


aga ug Lcaga 


y Ld.cdd.agy d 


v-Lay LyaL uy 


OtV/ 


atgttttcta 


caaggaaaca 


tcttacacta 


caaccatcaa 


gcctgtgtcg 


tataaactcg 


900 


atggagttac 


ttacacagag 


attgaaccaa 


aattggatgg 


gtattataaa 


aaggataatg 


960 


cttactatac 


agagcagcct 


atagaccttg 


taccaactca 


accattacca 


aatgcgagtt 


1020 


ttgataattt 


caaactcaca 


tgttctaaca 








1050 


<210> 46 














<211> 1995 












<212> DNA 














<213> CORONAVIRUS 












<400> 46 
tttgtgcact 


catactcgct 


tacagtaata 


aaactgttgg 


cgagcttggt 


gatgtcagag 


60 


aaactatgac 


ccatcttcta 


cagcatgcta 


atttggaatc 


tgcaaagcga 


gttcttaatg 


120 


tggtgtgtaa 


acattgtggt 


cagaaaacta 


ctaccttaac 


gggtgtagaa 


gctgtgatgt 


180 


atatgggtac 


tctatcttat 


gataatctta 


agacaggtgt 


ttccattcca 


tgtgtgtgtg 


240 


gtcgtgatgc 


tacacaatat 


ctagtacaac 


aagagtcttc 


ttttgttatg 


atgtctgcac 


300 


cacctgctga 


gtataaatta 


cagcaaggta 


cattcttatg 


tgcgaatgag 


tacactggta 


360 


actatcagtg 


tggtcattac 


actcatataa 


ctgctaagga 


gaccctctat 


cgtattgacg 


420 


gagctcacct 


tacaaagatg 


tcagagtaca 


aaggaccagt 


gactgatgtt 


ttctacaagg 


480 


aaacatctta 


cactacaacc 


atcaagcctg 


tgtcgtataa 


actcgatgga 


gttacttaca 


540 


cagagattga 


accaaaattg 


gatgggtatt 


ataaaaagga 


taatgcttac 


tatacagagc 


600 


agcctataga 


ccttgtacca 


actcaaccat 


taccaaatgc 


gagttttgat 


aatttcaaac 


660 


tcacatgttc 


taacacaaaa 


tttgctgatg 


atttaaatca 
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cagcttcacg agagctatct gtcacattct tcccagactt gaatggcgat gtagtggcta 780 

ttgactatag acactattca gcgagtttca agaaaggtgc taaattactg cataagccaa 840 

ttgtttggca cattaaccag gctacaacca agacaacgtt caaaccaaac acttggtgtt 900 

tacgttgtct ttggagtaca aagccagtag atacttcaaa ttcatttgaa gttctggcag 960 

tagaagacac acaaggaatg gacaatcttg cttgtgaaag tcaacaaccc acctctgaag 1020 

aagtagtgga aaatcctacc atacagaagg aagtcataga gtgtgacgtg aaaactaccg 1080 

aagttgtagg caatgtcata cttaaaccat cagatgaagg tgttaaagta acacaagagt 1140 

taggtcatga ggatcttatg gctgcttatg tggaaaacac aagcattacc attaagaaac 1200 

ctaatgagct ttcactagcc ttaggtttaa aaacaattgc cactcatggt attgctgcaa 1260 

ttaatagtgt tccttggagt aaaattttgg cttatgtcaa accattctta ggacaagcag 1320 

caattacaac atcaaattgc gctaagagat tagcacaacg tgtgtttaac aattatatgc 1380 

cttatgtgtt tacattattg ttccaattgt gtacttttac taaaagtacc aattctagaa 1440 

ttagagcttc actacctaca actattgcta aaaatagtgt taagagtgtt gctaaattat 1500 

gtttggatgc cggcattaat tatgtgaagt cacccaaatt ttctaaattg ttcacaatcg 1560 

ctatgtggct attgttgtta agtatttgct taggttctct aatctgtgta actgctgctt 1620 

ttggtgtact cttatctaat tttggtgctc cttcttattg taatggcgtt agagaattgt 1680 

atcttaattc gtctaacgtt actactatgg atttctgtga aggttctttt ccttgcagca 1740 

tttgtttaag tggattagac tcccttgatt cttatccagc tcttgaaacc attcaggtga 1800 

cgatttcatc gtacaagcta gacttgacaa ttttaggtct ggccgctgag tgggttttgg 1860 

catatatgtt gttcacaaaa ttcttttatt tattaggtct ttcagctata atgcaggtgt 1920 

tctttggcta ttttgctagt catttcatca gcaattcttg gctcatgtgg tttatcatta 1980 

gtattgtaca aatgg 1995 

<210> 47 

<211> 1884 

<212> DNA 

<213> CORONAVIRUS 

<400> 47 

aattcttggc tcatgtggtt tatcattagt attgtacaaa tggcacccgt ttctgcaatg 60 

gttaggatgt acatcttctt tgcttctttc tactacatat ggaagagcta tgttcatatc 120 

atggatggtt gcacctcttc gacttgcatg atgtgctata agcgcaatcg tgccacacgc 180 

gttgagtgta caactattgt taatggcatg aagagatctt tctatgtcta tgcaaatgga 240 

ggccgtggct tctgcaagac tcacaattgg aattgtctca attgtgacac attttgcact 300 

ggtagtacat tcattagtga tgaagttgct cgtgatttgt cactccagtt taaaagacca 360 
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atcaacccta 

cttcacctct 

tttgtcaatt 

atagtttttg 

tacagtcagc 

ggagatagta 

acttttagtg 

gcaaagggtg 

gttgttgata 

tctgacttag 

gaaaacatga 

gcccaagtag 

ttatctgaac 

agactaactt 

aagggtggta 

gttcttgctg 

ggttacacaa 

atttctactg 

cgtggtggtt 

gagattggtt 

ttcttgcatt 

aaactcattg 

atttttaagg 

ggttctattt 

atcatacagt 

gctgagtact 



ctgaccagtc 

actttgacaa 

tagacaattt 

atggcaagtc 

tgatgtgcca 

ctgaagtttc 

ttcctatgga 

tagctttaga 

ccgatgttga 

aagtgacagg 

cgcccagaga 

caaaaagtca 

agctgcgtaa 

gtgctacaac 

agattgttag 

cattggtttg 

atgaaatcat 

atgattgttt 

catacaaaaa 

tcatagtgcc 

ttctacctcg 

agtatagtga 

atgctatggg 

cttatagtga 

ttcctaacac 

gtagacatgg 



atcgtatatt 
ggctggtcaa 
gagagctaac 
caaatgcgac 
acctattctg 
cgttaagatg 
aaaacttaag 
tggtgtcctt 
cacaaaggat 
tgacagttgt 
tcttggcgca 
caatgtttca 
acaaattcgt 
tagacaggtt 
tacttgtttt 
ttatatcgtt 
tggttacaaa 
tgcaaataaa 
tgacaaaagc 
tggcttaccg 
tgtttttagt 
ttttgctacc 
caaacctgtg 
gcttcgtcca 
ttacctggag 
taca 



S226CAS108 
gttgatagtg 
aagacctatg 
aacactaaag 
gagtctgctt 
ttgcttgacc 
tttgatgctt 
gcacttgttg 
tctacattcg 
gttattgaat 
aacaatttca 
tgtattgact 
ctcatctgga 
agtgctgcca 
gtcaatgtca 
aaacttatgc 
atgccagtac 
gccattcagg 
catgctggtt 
tgccctgtag 
ggtactgtgc 
gctgttggca 
tctgcttgcg 
ccatattgtt 
gacactcgtt 
ggttctgtta 



ST25 

ttgctgtgaa 

agagacatcc 

gttcactgcc 

ctaagtctgc 

aagctcttgt 

atgtcgacac 

ctacagctca 

tgtcagctgc 

gtctcaaact 

tgctcaccta 

gtaatgcaag 

atgtaaaaga 

agaagaacaa 

taactactaa 

ttaaggccac 

atacattgtc 

atggtgtcac 

ttgacgcatg 

tagctgctat 

tgagagcaat 

acatttgcta 

ttcttgctgc 

atgacactaa 

atgtgcttat 

gagtagtaac 



aaatggcgcg 

gctctcccat 

tattaatgtc 

ttctgtgtac 

atcagacgtt 

cttttcagca 

cagcgagtta 

ccgacaaggt 

ttcacatcac 

taataaggtt 

gcatatcaat 

ctacatgtct 

catacctttt 

aatctcactc 

attattgtgc 

aatccatgat 

tcgtgacatc 

gtttagccag 

cattacaaga 

caatggtgac 

cacaccttcc 

tgagtgtaca 

tttgctagag 

ggatggttcc 

aacttttgat 



420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1884 



<210> 48 

<211> 2020 

<212> DNA 

<213> CORONAVIRUS 



cactcgttat gtgcttatgg atggttccat catacagttt cctaacactt acctggaggg 60 

ttctgttaga gtagtaacaa cttttgatgc tgagtactgt agacatggta catgcgaaag 120 
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gtcagaagta ggtatttgcc tatctaccag tggtagatgg gttcttaata atgagcatta 180 

cagagctcta tcaggagttt tctgtggtgt tgatgcgatg aatctcatag ctaacatctt 240 

tactcctctt gtgcaacctg tgggtgcttt agatgtgtct gcttcagtag tggctggtgg 300 

tattattgcc atattggtga cttgtgctgc ctactacttt atgaaattca gacgtgtttt 360 

tggtgagtac aaccatgttg ttgctgctaa tgcacttttg tttttgatgt ctttcactat 420 

actctgtctg gtaccagctt acagctttct gccgggagtc tactcagtct tttacttgta 480 

cttgacattc tatttcacca atgatgtttc attcttggct caccttcaat ggtttgccat 540 

gttttctcct attgtgcctt tttggataac agcaatctat gtattctgta tttctctgaa 600 

gcactgccat tggttcttta acaactatct taggaaaaga gtcatgttta atggagttac 660 

atttagtacc ttcgaggagg ctgctttgtg tacctttttg ctcaacaagg aaatgtacct 720 

aaaattgcgt agcgagacac tgttgccact tacacagtat aacaggtatc ttgctctata 780 

taacaagtac aagtatttca gtggagcctt agatactacc agctatcgtg aagcagcttg 840 

ctgccactta gcaaaggctc taaatgactt tagcaactca ggtgctgatg ttctctacca 900 

accaccacag acatcaatca cttctgctgt tctgcagagt ggttttagga aaatggcatt 960 

cccgtcaggc aaagttgaag ggtgcatggt acaagtaacc tgtggaacta caactcttaa 1020 

tggattgtgg ttggatgaca cagtatactg tccaagacat gtcatttgca cagcagaaga 1080 

catgcttaat cctaactatg aagatctgct cattcgcaaa tccaaccata gctttcttgt 1140 

tcaggctggc aatgttcaac ttcgtgttat tggccattct atgcaaaatt gtctgcttag 1200 

gcttaaagtt gatacttcta accctaagac acccaagtat aaatttgtcc gtatccaacc 1260 

tggtcaaaca ttttcagttc tagcatgcta caatggttca ccatctggtg tttatcagtg 1320 

tgccatgaga cctaatcata ccattaaagg ttctttcctt aatggatcat gtggtagtgt 1380 

tggttttaac attgattatg attgcgtgtc tttctgctat atgcatcata tggagcttcc 1440 

aacaggagta cacgctggta ctgacttaga aggtaaattc tatggtccat ttgttgacag 1500 

acaaactgca caggctgcag gtacagacac aaccataaca ttaaatgttt tggcatggct 1560 

gtatgctgct gttatcaatg gtgataggtg gtttcttaat agattcacca ctactttgaa 1620 

tgactttaac cttgtggcaa tgaagtacaa ctatgaacct ttgacacaag atcatgttga 1680 

catattggga cctctttctg ctcaaacagg aattgccgtc ttagatatgt gtgctgcttt 1740 

gaaagagctg ctgcagaatg gtatgaatgg tcgtactatc cttggtagca ctattttaga 1800 

agatgagttt acaccatttg atgttgttag acaatgctct ggtgttacct tccaaggtaa 1860 

gttcaagaaa attgttaagg gcactcatca ttggatgctt ttaactttct tgacatcact 1920 

attgattctt gttcaaagta cacagtggtc actgtttttc tttgtttacg agaatgcttt 1980 

cttgccattt actcttggta ttatggcaat tgctgcatgt 2020 



<210> 49 
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<211> 2040 

<212> DNA 

<213> CORONAVIRUS 



<400> 49 
aacatttcca 

cl y \_ ci v. *- »_ v» «.* 


gcctgaagac 


gtactgtagc agctaaactg 


cccagcacca 


tacctctatt 


60 




aagcctttiga 


tgaagtacaa gtatttcact 


ttaggccctt 


ttggtgtgtc 


120 


■tataacaaac 


ctacaaaqtq 


gttccagttc tgtgtaaatt 


gtacctgtac 


catcactctt 


180 


aaaaaatcta 


gcccatttga 


gatcttggtg gtctgatagt 


aatgccagca 


caaacctacc 


240 


■trrrttcaaa 


ttgttatagt 


aggcaagtgc attgtcatca 


gtacaagctg 


tttgtgtggt 


300 


aecaaccaca 


caggacatct 


gtcgtagtgc tactggactc 


agttcattat 


tctgtagttt 


360 


aacaactaao 


ttggctctta 


gagctgtaac 


aataagaggc 


caagccaaat 


ttggtgaatt 


420 


gtccatgtta 


atttcactaa 


gttgaacaat 


cttgctatcc 


gcatcaacaa 


cttgctggat 


480 


ttcccaaaat: 


acaaatacat: 


atgtaaaggt 


gttaccatca 


caagtgttct 


tgtaggtacc 


540 


ataaticaaaa 


acaacaacca 


tgagtttggc 


tgctgtagtc 


aatggtatga 


tgttgagtgg 


600 


aacacaacca 


tcacgcgcat 


tgttgataat 


gttgttaagt 


gcatcattat 


caagcttcct 


660 


aaacataata 


aagagcattg 


tttgcatagc 


actagttact 


tttgccctct 


tgtcctcaga 


720 


ticttacctat 


ttgtacattt 


gggtcatagc 


ctgatctgcc 


atcttttcca 


acttgcgttg 


780 


catggcagca 


tcacggtcaa 


actcagattt 


agccacattc 


aaagatttct 


ttaacttttt 


840 


gagaacgact 


tcagaatcac 


cattagctac 


agcctgctca 


taggcctcct 


gggcagtggc 


900 


ataaacaaca 


tatgatggta 


aagaactaaa 


ttctgaagca 


atagcctgaa 


gagtagcacg 


960 


gttatcgagc 


atttcctcgc 


acaacctatt 


aatgtctaca 


gcaccctgca 


tggatagcaa 


1020 


aacagacaaa 


agagaaacca 


tcttctcgaa agcttcagtt 


gtgtcttttg 


caagaagaat 


1080 


atcattgtgg 


agttgtacac 


attgtgccca 


caatttagaa 


gatgactcta 


ctctaagttg 


1140 


ttgaagaacc 


gagagcagta 


ccacagatgt 


gcactttacg 


tcagacattt 


tagactgtac 


1200 


agtagcaacc 


ttgatacatg 


gtttacctcc 


aatacccaac 


aacttaatgt 


taagcttgaa 


1260 


a.y la LLda la 


LtdLLLL Lay 


gaggcaaaag 


cccctgggag 


ttcatatacc 


taaattctta 


1320 


tgtagagacc 


aagtagtcat 


aaacaccaag 


agtaagcctg 


aagtaacggt 


tgagtaaaca 


1380 


gaaaaggcca 


aagtagcagc 


agcaacaata 


gcctaagaaa 


caataaacaa 


gcatgataca 


1440 


ctgtaaggtg 


ttgccagtaa 


taaataacaa tgggtaatac 


tcaacacaca 


caaacactat 


1500 


agctctagct 


aaaaacatga 


tagtcgtaac 


gacaccagaa 


tagttagagg 


ttacagaaat 


1560 


aactaaggcc 


cacatggaaa 


tagcttgatc taaagcatta 


ccatagtaga 


ctttgtaaac 


1620 


aagtgtaatg 


acattcatca 


gtgtccaaac acgtctagca 


gcatcatcat 


aaacagtgcg 


1680 


agctgtcatg 


agaataagca 


aaactaaagc 


tgaagcatac 


ataacacaat 


ccttaagcct 


1740 


ataaccagac 


aagctagtgt 


cagccaattc aagccatgtc 


atgatacgca 


tcacccagct 


1800 



Page 77 



WO 2005/056584 



PCT/FR2004/003106 



S226CAS108.ST25 



agcaggcatg tagaccatat 


taaagtaagc 


aactgttgca agagaaggta 


acagaaacaa 


1860 


gcacaagaat gcgtgcttat 


gcttaacaag 


cagcatagca 


catgcagcaa 


ttgccataat 


1920 


accaagagta aatggcaaga 


aagcattctc 


gtaaacaaag 


aaaaacagtg 


accactgtgt 


1980 


actttgaaca agaatcaata 


gtgatgtcaa 


gaaagttaaa agcatccaat 


gatgagtgca 


2040 


<210> 50 














<211> 2012 












<212> DNA 














<213> CORONAVIRUS 












<400> 50 
cttgtaggtt 


tgttacagac 


acaccaaaag 


ggcctaaagt 


gaaatacttg 


tacttcatca 


60 


aaggcttaaa 


caacctaaat 


agaggtatgg 


tgctgggcag 


tttagctgct 


acagtacgtc 


120 


ttcaggctgg 


aaatgctaca 


gaagtacctg 


ccaattcaac tgtgctttcc 


ttctgtgctt 


180 


ttgcagtaga 


ccctgctaaa 


gcatataagg 


attacctagc aagtggagga 


caaccaatca 


240 


ccaactgtgt 


gaagatgttg 


tgtacacaca 


ctggtacagg 


acaggcaatt 


actgtaacac 


300 


cagaagctaa 


catggaccaa 


gagtcctttg 


gtggtgcttc 


atgttgtctg 


tattgtagat 


360 


gccacattga 


ccatccaaat 


cctaaaggat 


tctgtgactt 


gaaaggtaag 


tacgtccaaa 


420 


tacctaccac 


ttgtgctaat 


gacccagtgg 


gttttacact 


tagaaacaca 


gtctgtaccg 


480 


tctgcggaat 


gtggaaaggt 


tatggctgta 


gttgtgacca 


actccgcgaa 


cccttgatgc 


540 


agtctgcgga 


tgcatcaacg 


tttttaaacg 


ggtttgcggt 


gtaagtgcag 


cccgtcttac 


600 


accgtgcggc 


acaggcacta 


gtactgatgt 


cgtctacagg 


gcttttgata 


tttacaacga 


660 


aaaagttgct 


ggttttgcaa 


agttcctaaa 


aactaattgc 


tgtcgcttcc 


aggagaagga 


720 


tgaggaaggc 


aatttattag 


actcttactt 


tgtagttaag 


aggcatacta 


tgtctaacta 


780 


ccaacatgaa 


gagactattt 


ataacttggt 


taaagattgt 


ccagcggttg 


ctgtccatga 


840 


ctttttcaag 


tttagagtag 


atggtgacat 


ggtaccacat 


atatcacgtc 


agcgtctaac 


900 


taaatacaca 


atggctgatt 


tagtctatgc 


tctacgtcat 


tttgatgagg 


gtaattgtga 


960 


tacattaaaa 


gaaatactcg 


tcacatacaa 


ttgctgtgat gatgattatt 


tcaataagaa 


1020 


ggattggtat 


gacttcgtag 


agaatcctga 


catcttacgc 


gtatatgcta 


acttaggtga 


1080 


gcgtgtacgc 


caatcattat 


taaagactgt 


acaattctgc 


gatgctatgc 


gtgatgcagg 


1140 


cattgtaggc 


gtactgacat 


tagataatca 


ggatcttaat 


gggaactggt 


acgatttcgg 


1200 


tgatttcgta 


caagtagcac 


caggctgcgg 


agttcctatt 


gtggattcat 


attactcatt 


1260 


gctgatgccc 


atcctcactt 


tgactagggc 


attggctgct 


gagtcccata 


tggatgctga 


1320 


tctcgcaaaa 


ccacttatta 


agtgggattt 


gctgaaatat 


gattttacgg 


aagagagact 


1380 


ttgtctcttc 


gaccgttatt 


ttaaatattg 


ggaccagaca 
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ctgtttggat gataggtgta tccttcattg tgcaaacttt aatgtgttat tttctactgt 1500 

gtttccacct acaagttttg gaccactagt aagaaaaata tttgtagatg gtgttccttt 1560 

tgttgtttca actggatacc attttcgtga gttaggagtc gtacataatc aggatgtaaa 1620 

cttacatagc tcgcgtctca gtttcaagga acttttagtg tatgctgctg atccagctat 1680 

gcatgcagct tctggcaatt tattgctaga taaacgcact acatgctttt cagtagctgc 1740 

actaacaaac aatgttgctt ttcaaactgt caaacccggt aattttaata aagactttta 1800 

tgactttgct gtgtctaaag gtttctttaa ggaaggaagt tctgttgaac taaaacactt 1860 

cttctttgct caggatggca acgctgctat cagtgattat gactattatc gttataatct 1920 

gccaacaatg tgtgatatca gacaactcct attcgtagtt gaagttgttg ataaatactt 1980 

tgattgttac gatggtggct gtattaatgc ca 2012 

<210> 51 

<211> 1877 

<212> DNA 

<213> CORONAVIRUS 

<400> 51 

gtacttcgcg tacagtggca ataccatatg acagcttaaa tgtttcctca gtggctttga 60 

gcgtttctgc tgcgaaaagc ttgagtctct cagtacaagt gttggcaagt atgtaatcgc 120 

cagcattagt ccaatcacat gttgctatcg cattgaagtc agtgacattg tcactgccta 180 

cacatgtgtt tttgtataaa ccaaaaacct gaccattagc acataatgga aaactaatgg 240 

gaggcttatg tgacttgcaa taatagctca tacctcctag atacagttgt gtcacatcag 300 

tgacatcaca acctggggca ttgcaaacat agggattaac agacaacact aatttgtgtg 360 

atgttgaaat gacatggtca tagcagcact tgcaacatag gaatggtctc ctaatacagg 420 

caccgcaacg aagtgaagtc tgtgaattgc acaatacaca agcacctaca gcctgcaaga 480 

ctgtatgtgg tgtgtacata gcctcataaa actcaggttc ccagtaccgt gaggtgttat 540 

cattagttag cattacggaa tacatgtcca acatgtggcc agtaagctca tcatgtaact 600 

ttctaatgta ttgtaaatac aagtgaaaga catcagcata ctcctgatta ggatgttttg 660 

taagtgggta agcatcaata gccagtgaca cgaacctttc aatcataagt gtaccatctg 720 

ttttgacaat atcatcgaca aaacagcctg cgcctaatat tcttgatgga tctgggtaag 780 

gcaggtacac gtaatcatct ccttgtttaa ctagcattgt atgctgtgag caaaattcgt 840 

gaggtccttt agtaaggtca gtctcagtcc aacattttgc ctcagacatg aacacattat 900 

tttgataata aagaactgcc ttaaagttct taatgctagc tactaaacct tgagccgcat 960 

agttactgtt atagcacaca acggcatcat cagaaagaat catcatggag aaatgtttac 1020 

gcaggtaagc gtaaaactca tccacgaatt catgatcaac atccctattt ctatagagac 1080 
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actcatagag cctgtgttgt agattgcgga catacttgtc agctatctta ttaccatcag 1140 

ttgaaagaag tgcatttaca ttggctgtaa cagcttgaca aatgttaaag acactattag 1200 

cataagcagt tgtagcatca ccggatgatg ttccacctgg tttaacatat agtgagccgc 1260 

cacacatgac catctcactt aatacttgcg cacactcgtt agctaacctg tagaaacggt 1320 

gtgataagtt acagcaagtg ttatgtttgc gagcaagaac aagagaggcc attatcctaa 1380 

gcatgttagg catggctctg tcacattttg gataatccca acccataagg tgtggagttt 1440 

ctacatcact gtaaacagtt tttaacatat tatgccagcc accgtaaaac ttgcttgttc 1500 

caattaccac agtagctcct ctagtggcgg ctattgactt caataatttc tgatgaaact 1560 

gtctatttgt catagtacta cagatagaga caccagctac ggtgcgagct ctattctttg 1620 

cactaatggc atacttaaga ttcatttgag ttatagtagg gatgacatta cgcttagtat 1680 

acgcgaaaag tgcatcttga tcctcataac tcattgagtc ataataaagt ctagccttac 1740 

cccatttatt aaatgggaaa ccagctgatt tatccagatt gttaacgatt acttggttgg 1800 

cattaataca gccaccatcg taacaatcaa agtatttatc aacaacttca actacgaata 1860 

ggagttgtct gatatca 1877 

<210> 52 

<211> 2051 

<212> DNA 

<213> CORONAVIRUS 

<400> 52 

tcaggtccaa tcttgacaaa gtacttcatt gatgtaagct caaagccatg cgcccaaagg 60 

acgaacacga ctctgtctga caatcctttc agtgtatcac tgagcatttg tactatctta 120 

atacgcacta cattccaggg caagccttta tacatgagtg gtataagatg tttaaactgg 180 

tcacctggtg gaggttttgc attaactctg gtgaattctg tgttattttc agtgtcaaca 240 

taaccagtcg gtacagctac taagttaaca cctgtagaaa atcctagctg gagaggtagg 300 

ttagtaccca cagcatctct agttgcatga cagccctcta catcaaagcc aatccacgca 360 

cgaacgtgac gaatagcttc ttcgcgggtg ataaacatat tagggtaacc attgacttgg 420 

taattcattt tgaaacccat catagagatg agtctacggt aggtcatgtc ctttggtatg 480 

cctggtatgt caacacataa tccttcagtc ttgaacttta tatcaacgct gaggtgtgta 540 

ggtgcctgtg taggatgaag accagtaatg atcttactac agtccttaaa aagtccagtt 600 

acattttctg cttgtaatgt agccacattg cgacgtggta tttctagact tgtaaattgc 660 

agtttgtcat aaagatctct atcagacatt atgcacaaaa tgccaatttt tgcccttgtg 720 

atagccacat tgaagcggtt gacattacaa gagtgtgctg tttcagtagt ttgtgtgaat 780 

atgacatagt catattcaga accctgtgat gaatcaacag tctgcgtagg caatcctaag 840 
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atttttgaag 


ctacagcgtt 


ctgtgaatta 


taaggtgaga 


taaaaacagc 


ttttctccaa 


900 


gcaggattgc 


gtgtaagaaa 


ttctcttaca 


acgcctattt 


gaggtctgtt 


gattgcagat 


960 


gaaacatcat 


gtgtaataac 


acctttgtag 


aacattttga 


agcattgagc 


tgacttatcc 


1020 


ttgtgtgctt 


ttagcttatt 


gtcataaact 


aaagcactca 


cagtgtcaac 


aatttcagca 


1080 


ggacaacggc 


gacaagttcc aaggaacatg 


tctggaccta 


ttgttttcat 


aagtctgcac 


1140 


actgaattaa 


aatattctgg ttctagtgtg 


cctttagtca 


gcaatgtgcg 


gggggctggt 


1200 


aattgagcag 


gatcgccaat 


atagacgtag 


tgttttgcac 


gaagtctagc 


attgacaaca 


1260 


ctcaagtcat 


aattagtagc 


catagagatt 


tcatcaaaga 


ctacaatgtc 


agcagttgtt 


1320 


tctggcaatg 


catttacagt 


gcagaaaaca 


tactgttcta 


gtgttgaatt 


cactttgaat 


1380 


ttatcaaaac 


actctacgcg 


cgcacgcgca 


ggtatgattc 


tactacattt 


atctatgggc 


1440 


aaatatttta 


atgccttttc 


acatagggca 


tcaacagctg 


catgagagca 


tgccgtatac 


1500 


actatgcgag 


cagatgggta 


atagagagca 


agtccgatgg 


caaaatgact 


cttaccagta 


1560 


ccaggtggtc 


cttggagtgt 


agagtacttt 


tgcatgccga 


ccttttgata 


atttgcaaca 


1620 


ttgctagaaa 


actcatctga 


gatgttgagt 


gttgggtaca 


agccagtaat 


tctcacatag 


1680 


tgctcttgtg 


gcactagagt 


aggtgcacta 


agtggcatta 


cagtgtgaga 


tgtcaacaca 


1740 


aagtaatcac 


caacattcaa 


cttgtatgtc 


gtagtacctc 


tgtacacaac 


agcatcacca 


1800 


tagtcacctt 


tttcaaaggt 


gtactctcca 


atctgtactt 


tactattttt 


agttacacgg 


1860 


taaccagtaa 


agacatagtt 


tctgttcaat 


ggxgg ic xag 


y LLL L LLaat 


rtrrratoaa 


1920 


agatgcaatt 


ctctgtcaga 


gagtacttcg 


cgtacagtgg 


caataccata 


tgacagctta 


1980 


aatgtttcct 


cagtggcttt 


gagcgtttct 


gctgcgaaaa 


gcttgagtct 


ctcagtacaa 


2040 


gtgttggcaa 


g 










2051 


<210> 53 














<211> 2075 












<212> DNA 














<213> CORONAVIRUS 












<400> 53 

tgcttgtagt tttgggtaga aggtttcaac 


atgtccatcc 


ttacaccaaa 


gcatgaatga 


60 


aatttcagca tagtcaattg taaccttgac 


cacttttgaa 


atcactgaca 


aatcttgtga 


120 


ctttattatc tcgacaaagt 


catcaagtaa 


aagatcaatc 


acagaacaca 


cacattttga 


180 


tgaacctgtt 


tgcgcatctg 


ttatgaagta 


atttttcact 


gtgctgtcca 


tagggataaa 


240 


atcctctaat 


ttaagtggtg 


aatcttgtga 


gcgcttggct 


aagcctatca 


ttaaatgaag 


300 


accgccaagt tgtccatgac tgaaatctcc 


ataaacgatg 


tgttcgaagg 


catagccctc 


360 


gagcttatat cgctgtatga attcatccat 


agcgagctcg agaaagtcag 
page 81 
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tgatctgggc ttaaaatcct ctaagtctct gctctgagta aagtaggttt caggcaactg 480 

ttgaataatg ccgtctactt tcttaaagta gttaaactgt gtttttactg attctccaat 540 

taatgtgact ccattgacgc tagcttgtgc tggtcccttt gaaggtgtta gacctttgac 600 

tgaaccttct gttattaaaa caccattacg ggcgtttcta aaaaggtcta cctgtccttc 660 

cactctacca tcaaacaaga cagtaagtga agaacaagca ctctcagtag gtttcttggc 720 

aatgtcagtc attgtgcaga cacctattgt agatacatgt gctggggctt ctcttttgta 780 

gtcccagatt acagtattag cagcgatatc aacacccaaa ttattgagta tcttaatctc 840 

tggcactggt ttaatgttac gcttagccca aagctcaaat gcaacattaa caggaagtgt 900 

tgtcttattt tcaaagatct ccacatcaat accatctacc tttgtgtaaa cagcattatt 960 

aatgatggaa acaggtgctt cgccggcgtg tccatcaaag tgtcctttat taacaacatt 1020 

ataagccaca ttttctaaac tctgtaacct ggtaaatgta ttccacaggt tataagtatc 1080 

aaattgtttg taaatccata ggctaaatcc agcagaaatc atcatattat atgcatccaa 1140 

gtactgtcgg tactcatttg catggtgtct gcaaacagca ccacctaaat tgcatcgtgt 1200 

aatacacgta gcagatttga gtggaacata atcaatatcc gacactactt gtttgccatg 1260 

agactcacaa ggactatcag aatagtaaaa gaaaggcaat tgctttaaat tagtaaatgc 1320 

acttttatcg aaagctggag tgtggaatgc atgcttattc acatacaaac taccaccatc 1380 

acagcctggt aagttcaagt ttgacaagac tcttgtgtca aacctacaca caattgcatt 1440 

ggctgggtaa cgatcaacgt tacaattcca aaacaaacaa acaccatcag tgaatttatc 1500 

gtgatgtgta gcataagaat agaagagttc ctctattttg taagctttgt cactacatgg 1560 

ctgagcatcg tagaacttcc attctacttc agcctgaggc acacacttga tagcctttgg 1620 

atttccaatg tcatgaagaa ctggaaactt atcagcaagc aatgcagact tcacaaccat 1680 

gtgttgtact tttctgcaag cagaattaac cctcagttca tctcctataa tagggtattc 1740 

aacagaccaa tcaacgcgct taacaaagca ctcatggact gctaaacatc tagtcatgat 1800 

agcatcacaa ctagccacat gtgcatttcc atgtacctgg caatgttggt catggttact 1860 

ctgaaggtta cccgtaaagc cccactgctg aacatcaatc ataaatgggt tatagacata 1920 

gtcaaaaccc acagaatgat tccagcaggc ataagtatct gatgaagtag aaaagcaagt 1980 

tgcacgtttg tcacacagac aacacgttct ttcaggtcca atcttgacaa agtacttcat 2040 

tgatgtaagc tcaaagccat gcgcccaaag gacga 2075 

<210> 54 

<211> 1891 

<212> DNA 

<213> CORONAVIRUS 
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<400> 54 
aagattcacc 


acttaaatta 


gaggatttta 


tccctatgga 


cagcacagtg 


aaaaattact 


60 


tcataacaga 


tgcgcaaaca 


ggttcatcaa 


aatgtgtgtg 


ttctgtgatt 


gatcttttac 


120 


ttgatgactt 


tgtcgagata 


ataaagtcac 


aagatttgtc 


agtgatttca 


aaagtggtca 


180 


aggttacaat 


tgactatgct 


gaaatttcat 


tcatgctttg 


gtgtaaggat 


ggacatgttg 


240 


aaaccttcta 


cccaaaacta 


caagcaagtc 


aagcgtggca 


accaggtgtt 


gcgatgccta 


300 


acttgtacaa 


gatgcaaaga 


atgcttcttg 


aaaagtgtga 


ccttcagaat 


tatggtgaaa 


360 


atgctgttat 


accaaaagga 


ataatgatga 


atgtcgcaaa 


gtatactcaa 


ctgtgtcaat 


420 


acttaaatac 


acttacttta 


gctgtaccct 


acaacatgag 


agttattcac 


tttggtgctg 


480 


gctctgataa 


aggagttgca 


ccaggtacag 


ctgtgctcag 


acaatggttg 


ccaactggca 


540 


cactacttgt 


cgattcagat 


cttaatgact 


tcgtctccga 


cgcagattct 


actttaattg 


600 


gagactgtgc 


aacagtacat 


acggctaata 


aatgggacct 


tattattagc 


gatatgtatg 


660 


accctaggac 


caaacatgtg 


acaaaagaga 


atgactctaa 


agaagggttt 


ttcacttatc 


720 


tgtgtggatt 


tataaagcaa 


aaactagccc 


tgggtggttc 


tatagctgta 


aagataacag 


780 


agcattcttg 


gaatgctgac 


ctttacaagc 


ttatgggcca 


tttctcatgg 


tggacagctt 


840 


ttgttacaaa 


tgtaaatgca 


tcatcatcgg 


aagcattttt 


aattggggct 


aactatcttg 


900 


gcaagccgaa 


ggaacaaatt 


gatggctata 


ccatgcatgc 


taactacatt 


ttctggagga 


960 


acacaaatcc 


tatccagttg 


tcttcctatt 


cactctttga 


catgagcaaa 


tttcctctta 


1020 


aattaagagg 


aactgctgta 


atgtctctta 


aggagaatca 


aatcaatgat 


atgatttatt 


1080 


ctcttctgga 


aaaaggtagg 


cttatcatta 


gagaaaacaa 


cagagttgtg 


gtttcaagtg 


1140 


atattcttgt 


taacaactaa 


acgaacatgt 


ttattttctt 


attatttctt 


actctcacta 


1200 


gtggtagtga 


ccttgaccgg 


tgcaccactt 


ttgatgatgt 


tcaagctcct 


aattacactc 


1260 


aacatacttc 


atctatgagg 


ggggtttact 


atcctgatga 


aatttttaga 


tcagacactc 


1320 


tttatttaac 


tcaggattta 


tttcttccat 


tttattctaa 


tgttacaggg 


tttcatacta 


1380 


ttaatcatac 


gtttggcaac 


cctgtcatac 


cttttaagga 


tggtatttat 


tttgctgcca 


1440 


cagagaaatc 


aaatgttgtc 


cgtggttggg 


tttttggttc 


taccatgaac 


aacaagtcac 


1500 


agtcggtgat 


tattattaac 


aattctacta 


atgttgttat 


acgagcatgt 


aactttgaat 


1560 


tgtgtgacaa 


ccctttcttt 


gctgtttcta 


aacccatggg 


tacacagaca 


catactatga 


1620 


tattcgataa 


tgcatttaat 


tgcactttcg 


agtacatatc 


tgatgccttt 


tcgcttgatg 


1680 


tttcagaaaa 


gtcaggtaat 


tttaaacact 


tacgagagtt 


tgtgtttaaa 


aataaagatg 


1740 


ggtttctcta 


tgtttataag 


ggctatcaac 


ctatagatgt 


agttcgtgat 


ctaccttctg 


1800 


gttttaacac 


tttgaaacct 


atttttaagt 


tgcctcttgg 


tattaacatt 


acaaatttta 


1860 


gagccattct 


tacagccttt 


tcacctgctc 


a 






1891 



<210> 55 
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<211> 32 
<212> DNA 

<213> ARTIFICIAL SEQUENCE 



<220> 

<223> amorce N sens 
<400> 55 

cccatatgtc tgataatgga ccccaatcaa ac 32 

<210> 56 

<211> 32 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce N antisens 

<400> 56 

cccccgggtg cctgagttga atcagcagaa gc 32 

<210> 57 

<211> 31 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce Sc sens 

<400> 57 

cccatatgag tgaccttgac cggtgcacca c 31 

<210> 58 
<211> 30 
<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce SL sens 
<400> 58 

cccatatgaa accttgcacc ccacctgctc 30 
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<210> 59 
<211> 33 
<212> DNA 

<213> amorce sc et sl antisens 
<400> 59 

cccccgggtt taatatattg ctcatatttt ccc 33 

<210> 60 
<211> 16 
<212> DNA 

<213> amorce sens serie 1 
<400> 60 

ggcatcgtat gggttg 16 

<210> 61 
<211> 16 
<212> DNA 

<213> amorce antisens serie 2 (28774-28759) 
<400> 61 

cagtttcacc acctcc 16 

<210> 62 
<211> 16 
<212> DNA 

<213> amorce sens serie 2 (28375-28390) 
<400> 62 

ggctactacc gaagag 16 

<210> 63 

<211> 16 

<212> DNA 

<213> amorce antisens serie 2 (28702-28687) 
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<400> 63 
aattaccgcg actacg 



16 



<210> 64 

<211> 26 

<212> DNA 

<213> sonde 1/serie 1 C28561-28586) 

<400> 64 

ggcacccgca atcctaataa caatgc 26 

<210> 65 

<211> 21 

<212> DNA 

<213> sonde 2/serie 1 (28588-28608) 



<210> 66 

<211> 23 

<212> DNA 

<213> sonde 1/serie 2 /sonde n/fl (28541-28563) 

<400> 66 

atacacccaa agaccacatt ggc 23 

<210> 67 

<211> 25 

<212> DNA 

<213> sonde 2/serie 2/sonde SARS/N/LC705 (28565-28589) 



<400> 65 

gccaccgtgc tacaacttcc t 



21 



<400> 67 

cccgcaatcc taataacaat gctgc 



25 



<210> 68 



<211> 30 



<212> DNA 



<213> artificial sequence 
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<220> 

<223> amorce ancre 14T 
<400> 68 

agatgaattc ggtacctttt tttttttttt 30 

<210> 69 

<211> 13 

<212> PRT 

<213> artificial sequence 



<220> 

<223> peptide M2-14 
<400> 69 

Ala Asp Asn Gly Thr lie Thr val Glu Glu Leu Lys Gin 
1 5 10 

<210> 70 

<211> 12 

<212> PRT 

<213> artificial sequence 
<220> 

<223> peptide El- 12 

<400> 70 

Met Tyr ser Phe val Ser Glu Glu Thr Gly Thr Leu 
1 5 10 

<210> 71 
<211> 24 
<212> PRT 

<213> artificial sequence 
<220> 

<223> peptide E53-72 
<400> 71 

Lys pro Thr val Tyr Val Tyr Ser Arg Val Lys Asn Leu Asn Ser ser 
1 5 10 15 
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Glu Gly val Pro Asp Leu Leu val 
20 

<210> 72 

<211> 153 

<212> DNA 

<213> CORONAVIRUS 



<400> 72 

gatattaggt ttttacctac ccaggaaaag ccaaccaacc tcgatctctt gtagatctgt 60 

tctctaaacg aactttaaaa tctgtgtagc tgtcgctcgg ctgcatgcct agtgcaccta 120 

cgcagtataa acaataataa attttactgt cgt 153 

<210> 73 

<211> 410 

<212> DNA 

<213> CORONAVIRUS 



<400> 73 
ttctccagac 


aacttcaaaa 


ttccatgagt 


ggagcttctg 


ctgattcaac 


tcaggcataa 


60 


acactcatga 


tgaccacaca 


aggcagatgg 


gctatgtaaa 


cgttttcgca 


attccgttta 


120 


cgatacatag 


tctactcttg 


tgcagaatga 


attctcgtaa 


ctaaacagca 


caagtaggtt 


180 


tagttaactt 


taatctcaca 


tagcaatctt 


taatcaatgt 


gtaacattag 


ggaggacttg 


240 


aaagagccac 


cacattttca 


tcgaggccac 


gcggagtacg 


atcgagggta 


cagtgaataa 


300 


tgctagggag 


agctgcctat 


atggaagagc 


cctaatgtgt 


aaaattaatt 


ttagtagtgc 


360 


tatccccatg tgattttaat 


agcttcttag 


gagaatgaca 


aaaaaaaaaa 




410 



<210> 74 

<211> 4382 

<212> PRT 

<213> CORONAVIRUS 



<400> 74 

Met Glu Ser Leu val Leu Gly val Asn Glu Lys Thr His val Gin Leu 
15 10 15 

ser Leu Pro Val Leu Gin val Arg Asp Val Leu val Arg Gly phe Gly 
20 25 30 
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Asp ser Val Glu Glu Ala Leu ser Glu Ala Arg Glu His Leu Lys Asn 
35 40 45 



Gly Thr cys Gly Leu Val Glu Leu Glu Lys Gly Val Leu Pro Gin Leu 
50 55 60 



Glu Gin Pro Tyr Val Phe lie Lys Arg ser Asp Ala Leu Ser Thr Asn 
65 70 75 80 



His Gly His Lys val val Glu Leu val Ala Glu Met Asp Gly He Gin 
85 90 95 



Tyr Gly Arg Ser Gly lie Thr Leu Gly val Leu Val Pro His Val Gly 
100 105 110 



Glu Thr Pro lie Ala Tyr Arg Asn Val Leu Leu Arg Lys Asn Gly Asn 
115 * 120 125 



Lys Gly Ala Gly Gly His ser Tyr Gly lie Asp Leu Lys ser Tyr Asp 
130 135 140 



Leu Gly Asp Glu Leu Gly Thr Asp Pro lie Glu Asp Tyr Glu Gin Asn 
145 150 155 160 



Trp Asn Thr Lys His Gly ser Gly Ala Leu Arg Glu Leu Thr Arg Glu 
165 170 175 



Leu Asn Gly Gly Ala val Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 
180 185 190 



Pro Asp Gly Tyr Pro Leu Asp cys lie Lys Asp Phe Leu Ala Arg Ala 
195 200 205 



Gly Lys Ser Met Cys Thr Leu Ser Glu Gin Leu Asp Tyr lie Glu Ser 
210 215 220 



Lys Arg Gly val Tyr cys cys Arg Asp His Glu His Glu lie Ala Trp 
225 230 235 240 



Phe Thr Glu Arg Ser Asp Lys Ser Tyr Glu His Gin Thr Pro Phe Glu 
245 250 255 



lie Lys ser Ala Lys Lys Phe Asp Thr Phe Lys Gly Glu cys Pro Lys 
260 265 270 



Phe Val Phe Pro Leu Asn Ser Lys Val Lys val lie Gin Pro Arg val 
275 280 285 



Glu Lys Lys Lys Thr Glu Gly Phe Met Gly Arg lie Arg ser val Tyr 




295 



300 
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Pro Val Ala Ser Pro Gin Glu Cys Asn Asn Met His Leu Ser Thr Leu 
305 310 315 320 

Met Lys Cys Asn His Cys Asp Glu Val Ser Trp Gin Thr Cys Asp Phe 
325 330 335 

Leu Lys Ala Thr Cys Glu His Cys Gly Thr Glu Asn Leu val lie Glu 
340 345 350 

Gly Pro Thr Thr cys Gly Tyr Leu Pro Thr Asn Ala Val Val Lys Met 
355 360 365 

Pro cys Pro Ala cys Gin Asp Pro Glu lie Gly Pro Glu His Ser val 
370 375 380 

Ala Asp Tyr His Asn His ser Asn lie Glu Thr Arg Leu Arg Lys Gly 
385 390 395 " 400 

Gly Arg Thr Arg cys Phe Gly Gly cys val Phe Ala Tyr val Gly Cys 
405 410 415 

Tyr Asn Lys Arg Ala Tyr Trp val Pro Arg Ala ser Ala Asp lie Gly 
420 425 430 

ser Gly His Thr Gly lie Thr Gly Asp Asn val Glu Thr Leu Asn Glu 
435 440 445 

Asp Leu Leu Glu lie Leu ser Arg Glu Arg Val Asn lie Asn lie val 
450 455 460 

Gly Asp Phe His Leu Asn Glu Glu val Ala lie lie Leu Ala Ser Phe 
465 470 475 480 

ser Ala ser Thr ser Ala Phe lie Asp Thr lie Lys Ser Leu Asp Tyr 
485 490 495 

Lys ser Phe Lys Thr lie Val Glu ser cys Gly Asn Tyr Lys Val Thr 
500 505 510 

Lys Gly Lys Pro val Lys Gly Ala Trp Asn lie Gly Gin Gin Arg ser 
515 520 525 

Val Leu Thr Pro Leu cys Gly Phe Pro ser Gin Ala Ala Gly val lie 
530 535 540 

Arg ser lie Phe Ala Arg Thr Leu Asp Ala Ala Asn His ser lie Pro 
545 550 555 560 

Asp Leu Gin Arg Ala Ala Val Thr lie Leu Asp Gly lie Ser Glu Gin 
565 570 575 
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Ser Leu Arg Leu Val Asp Ala Met Val Tyr Thr Ser Asp Leu Leu Thr 
580 585 590 

Asn ser val lie lie Met Ala Tyr val Thr Gly Gly Leu Val Gin Gin 
595 600 605 

Thr ser Gin Trp Leu Ser Asn Leu Leu Gly Thr Thr val Glu Lys Leu 
610 615 620 

Arg Pro lie Phe Glu Trp lie Glu Ala Lys Leu Ser Ala Gly val Glu 
625 630 635 640 

Phe Leu Lys Asp Ala Trp Glu lie Leu Lys Phe Leu lie Thr Gly val 
645 650 655 

Phe Asp lie val Lys Gly Gin lie Gin val Ala Ser Asp Asn lie Lys 
660 665 670 

Asp Cys val Lys Cys Phe lie Asp Val val Asn Lys Ala Leu Glu Met 
675 680 685 

cys lie Asp Gin Val Thr lie Ala Gly Ala Lys Leu Arg ser Leu Asn 
690 695 700 

Leu Gly Glu val Phe lie Ala Gin ser Lys Gly Leu Tyr Arg Gin Cys 
705 710 715 ~ 720 

lie Arg Gly Lys Glu Gin Leu Gin Leu Leu Met Pro Leu Lys Ala Pro 
725 730 735 

Lys Glu Val Thr Phe Leu Glu Gly Asp ser His Asp Thr val Leu Thr 
740 745 750 

Ser Glu Glu Val Val Leu Lys Asn Gly Glu Leu Glu Ala Leu Glu Thr 
755 760 765 

Pro Val Asp ser Phe Thr Asn Gly Ala lie Val Gly Thr Pro val Cys 
770 775 780 

Val Asn Gly Leu Met Leu Leu Glu lie Lys Asp Lys Glu Gin Tyr cys 
785 790 795 800 

Ala Leu ser Pro Gly Leu Leu Ala Thr Asn Asn Val Phe Arg Leu Lys 
805 810 815 

Gly Gly Ala Pro lie Lys Gly Val Thr Phe Gly Glu Asp Thr Val Trp 
820 825 830 

Glu Val Gin Gly Tyr Lys Asn Val Arg lie Thr Phe Glu Leu Asp Glu 
835 840 845 
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Arg Val Asp Lys Val Leu Asn Glu Lys Cys Ser Val Tyr Thr Val Glu 
850 855 860 

Ser Gly Thr Glu val Thr Glu Phe Ala cys val val Ala Glu Ala val 
865 870 875 880 

Val Lys Thr Leu Gin Pro Val ser Asp Leu Leu Thr Asn Met Gly lie 
885 890 895 

Asp Leu Asp Glu Trp Ser Val Ala Thr Phe Tyr Leu Phe Asp Asp Ala 
900 905 910 

Gly Glu Glu Asn Phe ser ser Arg Met Tyr Cys Ser Phe Tyr Pro Pro 
915 920 925 

Asp GlU Glu Glu Glu Asp Asp Ala Gl U Cys Gl U Gl U Gl U Gl U lie Asp 
930 935 940 

Glu Thr cys Glu His Glu Tyr Gly Thr Glu Asp Asp Tyr Gin Gly Leu 
945 950 955 960 

Pro Leu Glu Phe Gly Ala ser Ala Glu Thr val Arg val Glu Glu Glu 
965 970 975 

Glu Glu Glu Asp Trp Leu Asp Asp Thr Thr Glu Gin Ser Glu lie Glu 
980 985 990 

pro Glu Pro Glu Pro Thr Pro Glu Glu Pro val Asn Gin Phe Thr Gly 
995 1000 1005 

Tyr Leu Lys Leu Thr Asp Asn Val Ala lie Lys cys Val Asp lie 
1010 1015 1020 

val Lys Glu Ala Gin ser Ala Asn Pro Met val lie val Asn Ala 
1025 1030 1035 

Ala Asn He His Leu Lys His Gly Gly Gly val Ala Gly Ala Leu 
1040 1045 1050 

Asn Lys Ala Thr Asn Gly Ala Met Gin Lys Glu ser Asp Asp Tyr 
1055 1060 1065 

lie Lys Leu Asn Gly Pro Leu Thr Val Gly Gly ser cys Leu Leu 
1070 1075 1080 

ser Gly His Asn Leu Ala Lys Lys cys Leu His Val val Gly Pro 
1085 1090 1095 

Asn Leu Asn Ala Gly Glu Asp lie Gin Leu Leu Lys Ala Ala Tyr 
1100 1105 1110 
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Glu Asn Phe Asn Ser Gin Asp lie Leu Leu Ala Pro Leu Leu Ser 
1115 1120 1125 

Ala Gly lie Phe Gly Ala Lys Pro Leu Gin ser Leu Gin val cys 
1130 1135 1140 

Val Gin Thr Val Arg Thr Gin Val Tyr lie Ala Val Asn Asp Lys 
1145 1150 1155 

Ala Leu Tyr Glu Gin Val val Met Asp Tyr Leu Asp Asn Leu Lys 
1160 1165 1170 

Pro Arg Val Glu Ala Pro Lys Gin Glu Glu Pro Pro Asn Thr Glu 
1175 1180 1185 

Asp Ser Lys Thr Glu Glu Lys Ser Val Val Gin Lys Pro val Asp 
1190 1195 1200 

Val Lys Pro Lys lie Lys Ala cys lie Asp Glu Val Thr Thr Thr 
1205 1210 1215 

Leu Glu Glu Thr Lys Phe Leu Thr Asn Lys Leu Leu Leu Phe Ala 
1220 1225 1230 

Asp lie Asn Gly Lys Leu Tyr His Asp ser Gin Asn Met Leu Arg 
1235 1240 1245 

Gly Glu Asp Met ser Phe Leu Glu Lys Asp Ala Pro Tyr Met Val 
1250 1255 1260 

Gly Asp val lie Thr ser Gly Asp lie Thr cys val Val lie Pro 
1265 1270 1275 

Ser Lys Lys Ala Gly Gly Thr Thr Glu Met Leu Ser Arg Ala Leu 
1280 1285 1290 

Lys Lys val Pro val Asp Glu Tyr lie Thr Thr Tyr Pro Gly Gin 
1295 1300 1305 

Gly cys Ala Gly Tyr Thr Leu Glu Glu Ala Lys Thr Ala Leu Lys 
1310 1315 1320 

Lys cys Lys ser Ala Phe Tyr Val Leu Pro Ser Glu Ala Pro Asn 
1325 1330 1335 

Ala Lys Glu Glu lie Leu Gly Thr val ser Trp Asn Leu Arg Glu 
1340 1345 1350 

Met Leu Ala His Ala Glu Glu Thr Arg Lys Leu Met Pro lie cys 
1355 1360 1365 
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Met Asp Val Arg Ala lie Met Ala Thr lie Gin Arg Lys Tyr Lys 
1370 1375 1380 

Gly lie Lys lie Gin Glu Gly lie Val Asp Tyr Gly Val Arg Phe 
1385 1390 1395 

Phe Phe Tyr Thr ser Lys Glu Pro Val Ala Ser lie lie Thr Lys 
1400 1405 1410 

Leu Asn ser Leu Asn Glu Pro Leu val Thr Met Pro He Gly Tyr 
1415 1420 1425 

Val Thr His Gly Phe Asn Leu Glu Glu Ala Ala Arg Cys Met Arg 
1430 1435 1440 

ser Leu Lys Ala Pro Ala Val Val Ser Val Ser Ser Pro Asp Ala 
1445 1450 1455 

val Thr Thr Tyr Asn Gly Tyr Leu Thr ser Ser Ser Lys Thr Ser 
1460 1465 1470 

Glu Glu His Phe Val Glu Thr Val Ser Leu Ala Gly ser Tyr Arg 
1475 1480 1485 

Asp Trp ser Tyr Ser Gly Gin Arg Thr Glu Leu Gly val Glu Phe 
1490 1495 ~ 1500 

Leu Lys Arg Gly Asp Lys lie Val Tyr His Thr Leu Glu ser Pro 
1505 1510 1515 

Val Glu Phe His Leu Asp Gly Glu val Leu ser Leu Asp Lys Leu 
1520 1525 1530 

Lys ser Leu Leu Ser Leu Arg Glu val Lys Thr lie Lys Val Phe 
1535 1540 1545 

Thr Thr val Asp Asn Thr Asn Leu His Thr Gin Leu Val Asp Met 
1550 1555 1560 

ser Met Thr Tyr Gly Gin Gin Phe Gly Pro Thr Tyr Leu Asp Gly 
1565 1570 1575 

Ala Asp Val Thr Lys lie Lys Pro His Val Asn His Glu Gly Lys 
1580 1585 1590 

Thr Phe Phe Val Leu Pro Ser Asp Asp Thr Leu Arg ser Glu Ala 
1595 1600 1605 

Phe Glu Tyr Tyr His Thr Leu Asp Glu Ser Phe Leu Gly Arg Tyr 
1610 1615 1620 
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Met Ser Ala Leu 
1625 



His 



Thr 
1630 



Lys 



Lys 



Trp Lys 



Phe 
1635 



Pro 



Gin 



val 



Gly Gly Leu Thr Ser lie Lys Trp Ala Asp Asn Asn Cys Tyr Leu 
1640 1645 1650 



ser Ser Val Leu Leu Ala Leu Gin Gin Leu Glu Val Lys Phe Asn 
1655 1660 1665 



Ala Pro Ala Leu Gin Glu Ala Tyr Tyr Arg Ala Arg Ala Gly Asp 
1670 1675 ~ 1680 



Ala Ala Asn Phe Cys Ala Leu lie Leu Ala Tyr ser Asn Lys Thr 
1685 1690 1695 



val Gly Glu Leu Gly Asp Val Arg Glu Thr Met Thr His Leu Leu 
1700 1705 1710 



Gin His Ala Asn Leu Glu Ser Ala Lys Arg val Leu Asn Val Val 
1715 1720 " 1725 



cys Lys His Cys Gly Gin Lys Thr Thr Thr Leu Thr Gly Val Glu 
1730 1735 1740 



Ala Val Met Tyr Met Gly Thr Leu ser Tyr Asp Asn Leu Lys Thr 
1745 1750 * 1755 



Gly Val ser lie Pro Cys val cys Gly Arg Asp Ala Thr Gin Tyr 
1760 1765 1770 



Leu Val Gin Gin Glu ser ser Phe val Met Met ser Ala Pro Pro 
1775 1780 1785 



Ala Glu Tyr Lys Leu Gin Gin Gly Thr Phe Leu cys Ala Asn Glu 
1790 1795 1800 



Tyr Thr Gly Asn Tyr Gin cys Gly His Tyr Thr His lie Thr Ala 
1805 1810 * 1815 



Lys Glu Thr Leu Tyr Arg lie Asp Gly Ala His Leu Thr Lys Met 
1820 1825 1830 



Ser Glu Tyr Lys Gly Pro Val Thr Asp Val Phe Tyr Lys Glu Thr 
1835 1840 1845 



ser Tyr Thr Thr Thr lie Lys Pro val Ser Tyr Lys Leu Asp Gly 
1850 1855 1860 



Val Thr Tyr Thr Glu lie Glu Pro Lys Leu Asp Gly Tyr Tyr Lys 



1865 



1870 
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Lys Asp Asn Ala Tyr Tyr Thr Glu Gin Pro lie Asp Leu Val pro 
1880 1885 1890 

Thr Gin Pro Leu Pro Asn Ala ser Phe Asp Asn Phe Lys Leu Thr 
1895 1900 1905 

Cys ser Asn Thr Lys Phe Ala Asp Asp Leu Asn Gin Met Thr Gly 
1910 1915 1920 

Phe Thr Lys Pro Ala Ser Arg Glu Leu Ser Val Thr Phe Phe Pro 
1925 1930 1935 

Asp Leu Asn Gly Asp Val val Ala lie Asp Tyr Arg His Tyr ser 
1940 1945 1950 

Ala ser Phe Lys Lys Gly Ala Lys Leu Leu His Lys Pro lie val 
1955 1960 1965 

Trp His lie Asn Gin Ala Thr Thr Lys Thr Thr Phe Lys Pro Asn 
1970 1975 1980 

Thr Trp cys Leu Arg Cys Leu Trp Ser Thr Lys Pro val Asp Thr 
1985 1990 1995 

Ser Asn Ser Phe Glu val Leu Ala Val Glu Asp Thr Gin Gly Met 
2000 2005 2010 

Asp Asn Leu Ala cys Glu ser Gin Gin Pro Thr ser Glu Glu Val 
2015 2020 2025 

val Glu Asn Pro Thr lie Gin Lys Glu Val lie Glu Cys Asp Val 
2030 2035 2040 

Lys Thr Thr Glu Val Val Gly Asn Val lie Leu Lys Pro Ser Asp 
2045 2050 2055 

Glu Gly val Lys Val Thr Gin Glu Leu Gly His Glu Asp Leu Met 
2060 2065 2070 

Ala Ala Tyr val Glu Asn Thr Ser lie Thr lie Lys Lys Pro Asn 
2075 2080 2085 

Glu Leu Ser Leu Ala Leu Gly Leu Lys Thr lie Ala Thr His Gly 
2090 2095 2100 

lie Ala Ala lie Asn Ser Val Pro Trp Ser Lys lie Leu Ala Tyr 
2105 2110 2115 

val Lys Pro Phe Leu Gly Gin Ala Ala lie Thr Thr Ser Asn Cys 
2120 2125 2130 
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Ala Lys Arg Leu Ala Gin Arg val Phe Asn Asn Tyr Met Pro Tyr 
2135 2140 2145 

Val Phe Thr Leu Leu Phe Gin Leu cys Thr Phe Thr Lys ser Thr 
2150 2155 2160 

Asn ser Arg lie Arg Ala ser Leu Pro Thr Thr lie Ala Lys Asn 
2165 2170 2175 

ser val Lys ser val Ala Lys Leu Cys Leu Asp Ala Gly lie Asn 
2180 2185 2190 

Tyr Val Lys ser Pro Lys Phe ser Lys Leu Phe Thr lie Ala Met 
2195 2200 2205 

Trp Leu Leu Leu Leu Ser lie cys Leu Gly Ser Leu lie cys Val 
2210 2215 2220 

Thr Ala Ala Phe Gly val Leu Leu Ser Asn Phe Gly Ala Pro ser 
2225 2230 2235 

Tyr Cys Asn Gly Val Arg Glu Leu Tyr Leu Asn ser ser Asn val 
2240 2245 2250 

Thr Thr Met Asp Phe cys Glu Gly Ser Phe Pro cys ser lie Cys 
2255 2260 2265 

Leu ser Gly Leu Asp Ser Leu Asp Ser Tyr Pro Ala Leu Glu Thr 
2270 2275 2280 

lie Gin Val Thr lie ser ser Tyr Lys Leu Asp Leu Thr lie Leu 
2285 2290 2295 

Gly Leu Ala Ala Glu Trp Val Leu Ala Tyr Met Leu Phe Thr Lys 
2300 2305 2310 

Phe Phe Tyr Leu Leu Gly Leu Ser Ala lie Met Gin Val Phe Phe 
2315 2320 2325 

Gly Tyr Phe Ala Ser His Phe lie ser Asn ser Trp Leu Met Trp 
2330 2335 2340 

Phe He lie ser lie Val Gin Met Ala Pro Val ser Ala Met Val 
2345 2350 2355 

Arg Met Tyr lie Phe Phe Ala Ser Phe Tyr Tyr lie Trp Lys Ser 
2360 2365 2370 

Tyr val His lie Met Asp Gly cys Thr Ser Ser Thr cys Met Met 
2375 2380 2385 
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cys Tyr Lys Arg Asn Arg Ala Thr Arg val Glu Cys Thr Thr lie 
2390 2395 2400 

Val Asn Gly Met Lys Arg Ser Phe Tyr Val Tyr Ala Asn Gly Gly 
2405 2410 2415 

Arg Gly Phe Cys Lys Thr His Asn Trp Asn cys Leu Asn Cys Asp 
2420 2425 2430 

Thr Phe Cys Thr Gly Ser Thr Phe lie Ser Asp Glu Val Ala Arg 
2435 2440 2445 

Asp Leu Ser Leu Gin Phe Lys Arg Pro lie Asn Pro Thr Asp Gin 
2450 2455 ~ 2460 

Ser ser Tyr lie Val Asp ser Val Ala Val Lys Asn Gly Ala Leu 
2465 2470 2475 

His Leu Tyr Phe Asp Lys Ala Gly Gin Lys Thr Tyr Glu Arg His 
2480 2485 " 2490 

Pro Leu Ser His Phe Val Asn Leu Asp Asn Leu Arg Ala Asn Asn 
2495 2500 2505 

Thr Lys Gly Ser Leu Pro lie Asn Val lie Val Phe Asp Gly Lys 
2510 2515 2520 

ser Lys cys Asp Glu ser Ala ser Lys ser Ala ser val Tyr Tyr 
2525 2530 2535 

Ser Gin Leu Met cys Gin Pro lie Leu Leu Leu Asp Gin Ala Leu 
2540 2545 2550 

val ser Asp Val Gly Asp ser Thr Glu val ser val Lys Met Phe 
2555 2560 2565 

Asp Ala Tyr val Asp Thr Phe ser Ala Thr Phe ser val Pro Met 
2570 2575 2580 

Glu Lys Leu Lys Ala Leu val Ala Thr Ala His ser Glu Leu Ala 
2585 2590 2595 

Lys Gly Val Ala Leu Asp Gly val Leu Ser Thr Phe val ser Ala 
2600 2605 2610 

Ala Arg Gin Gly Val Val Asp Thr Asp val Asp Thr Lys Asp Val 
2615 . 2620 2625 

lie Glu Cys Leu Lys Leu ser His His Ser Asp Leu Glu val Thr 
2630 2635 2640 
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Gly Asp Ser Cys Asn Asn Phe Met Leu Thr Tyr Asn Lys Val Glu 
2645 2650 2655 

Asn Met Thr Pro Arg Asp Leu Gly Ala Cys lie Asp Cys Asn Ala 
2660 2665 2670 

Arg His lie Asn Ala Gin Val Ala Lys ser His Asn Val Ser Leu 
2675 2680 2685 

lie Trp Asn Val Lys Asp Tyr Met ser Leu ser Glu Gin Leu Arg 
2690 2695 2700 

Lys Gin lie Arg ser Ala Ala Lys Lys Asn Asn lie Pro Phe Arg 
2705 2710 2715 

Leu Thr cys Ala Thr Thr Arg Gin Val Val Asn val lie Thr Thr 
2720 2725 2730 

Lys lie Ser Leu Lys Gly Gly Lys lie Val Ser Thr Cys Phe Lys 
2735 2740 2745 

Leu Met Leu Lys Ala Thr Leu Leu Cys val Leu Ala Ala Leu Val 
2750 2755 2760 

cys Tyr lie val Met Pro Val His Thr Leu Ser lie His Asp Gly 
2765 2770 2775 

Tyr Thr Asn Glu lie lie Gly Tyr Lys Ala lie Gin Asp Gly val 
2780 2785 2790 

Thr Arg Asp lie lie ser Thr Asp Asp Cys Phe Ala Asn Lys His 
2795 2800 2805 

Ala Gly Phe Asp Ala Trp Phe ser Gin Arg Gly Gly Ser Tyr Lys 
2810 2815 2820 

Asn Asp Lys ser Cys Pro val Val Ala Ala lie lie Thr Arg Glu 
2825 2830 2835 

lie Gly Phe lie Val Pro Gly Leu Pro Gly Thr val Leu Arg Ala 
2840 2845 2850 

lie Asn Gly Asp Phe Leu His Phe Leu Pro Arg Val Phe ser Ala 
2855 2860 2865 

Val Gly Asn lie cys Tyr Thr Pro Ser Lys Leu lie Glu Tyr ser 
2870 2875 2880 

Asp phe Ala Thr Ser Ala cys val Leu Ala Ala Glu cys Thr lie 
2885 2890 2895 
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Phe Lys Asp Ala Met Gly Lys Pro val Pro Tyr Cys Tyr Asp Thr 

2900 2905 2910 

Asn Leu Leu Glu Gly ser lie ser Tyr ser Glu Leu Arg Pro Asp 

2915 2920 2925 

Thr Arg Tyr val Leu Met Asp Gly ser lie lie Gin Phe Pro Asn 

2930 2935 2940 

Thr Tyr Leu Glu Gly Ser Val Arg Val Val Thr Thr Phe Asp Ala 

2945 2950 2955 

Glu Tyr cys Arg His Gly Thr Cys Glu Arg ser Glu val Gly lie 

2960 2965 2970 

cys Leu Ser Thr ser Gly Arg Trp Val Leu Asn Asn Glu His Tyr 

2975 2980 2985 

Arg Ala Leu ser Gly val Phe Cys Gly val Asp Ala Met Asn Leu 

2990 2995 3000 

lie Ala Asn lie Phe Thr Pro Leu Val Gin Pro Val Gly Ala Leu 

3005 3010 3015 

Asp Val ser Ala Ser Val Val Ala Gly Gly lie lie Ala lie Leu 

3020 3025 3030 

val Thr cys Ala Ala Tyr Tyr Phe Met Lys Phe Arg Arg Val Phe 

3035 3040 3045 

Gly Glu Tyr Asn His Val Val Ala Ala Asn Ala Leu Leu Phe Leu 

3050 3055 3060 

Met ser Phe Thr lie Leu Cys Leu val Pro Ala Tyr ser Phe Leu 

3065 3070 3075 

Pro Gly val Tyr ser Val Phe Tyr Leu Tyr Leu Thr Phe Tyr Phe 

3080 3085 3090 

Thr Asn Asp val ser Phe Leu Ala His Leu Gin Trp Phe Ala Met 

3095 3100 3105 

Phe Ser Pro lie Val Pro Phe Trp lie Thr Ala lie Tyr val Phe 

3110 3115 3120 

cys lie ser Leu Lys His cys His Trp Phe Phe Asn Asn Tyr Leu 

3125 3130 3135 

Arg Lys Arg val Met Phe Asn Gly Val Thr Phe ser Thr Phe Glu 

3140 ~ 3145 3150 
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Glu Ala Ala Leu Cys Thr Phe Leu Leu Asn Lys Glu Met Tyr Leu 
3155 3160 3165 

Lys Leu Arg Ser Glu Thr Leu Leu Pro Leu Thr Gin Tyr Asn Arg 
3170 3175 3180 

Tyr Leu Ala Leu Tyr Asn Lys Tyr Lys Tyr Phe Ser Gly Ala Leu 
3185 3190 3195 

Asp Thr Thr Ser Tyr Arg Glu Ala Ala Cys Cys His Leu Ala Lys 
3200 3205 3210 

Ala Leu Asn Asp Phe Ser Asn ser Gly Ala Asp val Leu Tyr Gin 
3215 3220 3225 

pro Pro Gin Thr ser lie Thr ser Ala val Leu Gin Ser Gly Phe 
3230 3235 3240 

Arg Lys Met Ala Phe Pro Ser Gly Lys Val Glu Gly Cys Met val 
3245 3250 3255 

Gin Val Thr Cys Gly Thr Thr Thr Leu Asn Gly Leu Trp Leu Asp 
3260 3265 3270 

Asp Thr Val Tyr Cys Pro Arg His Val lie Cys Thr Ala Glu Asp 
3275 3280 3285 

Met Leu Asn Pro Asn Tyr Glu Asp Leu Leu lie Arg Lys ser Asn 
3290 3295 3300 

His Ser Phe Leu Val Gin Ala Gly Asn val Gin Leu Arg val lie 
3305 3310 3315 

Gly His Ser Met Gin Asn Cys Leu Leu Arg Leu Lys Val Asp Thr 
3320 3325 3330 

Ser Asn Pro Lys Thr Pro Lys Tyr Lys Phe Val Arg lie Gin Pro 
3335 3340 3345 

Gly Gin Thr Phe Ser val Leu Ala cys Tyr Asn Gly ser Pro ser 
3350 3355 3360 

Gly Val Tyr Gin cys Ala Met Arg Pro Asn His Thr lie Lys Gly 
3365 3370 3375 

ser Phe Leu Asn Gly Ser Cys Gly ser val Gly Phe Asn lie Asp 
3380 3385 3390 

Tyr Asp cys val ser Phe cys Tyr Met His His Met Glu Leu Pro 
3395 3400 3405 
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Thr Gly Val His Ala Gly Thr Asp Leu Glu Gly Lys Phe Tyr Gly 
3410 3415 3420 

Pro Phe val Asp Arg Gin Thr Ala Gin Ala Ala Gly Thr Asp Thr 
3425 3430 3435 

Thr lie Thr Leu Asn Val Leu Ala Trp Leu Tyr Ala Ala Val lie 
3440 3445 3450 

Asn Gly Asp Arg Trp Phe Leu Asn Arg Phe Thr Thr Thr Leu Asn 
3455 3460 3465 

Asp Phe Asn Leu val Ala Met Lys Tyr Asn Tyr Glu Pro Leu Thr 
3470 3475 3480 

Gin Asp His Val Asp lie Leu Gly Pro Leu Ser Ala Gin Thr Gly 
3485 3490 3495 

lie Ala val Leu Asp Met Cys Ala Ala Leu Lys Glu Leu Leu Gin 
3500 3505 3510 

Asn Gly Met Asn Gly Arg Thr lie Leu Gly ser Thr lie Leu Glu 
3515 3520 3525 

Asp Glu Phe Thr Pro Phe Asp val Val Arg Gin Cys Ser Gly val 
3530 3535 ~ 3540 

Thr Phe Gin Gly Lys Phe Lys Lys lie Val Lys Gly Thr His His 
3545 3550 3555 

Trp Met Leu Leu Thr Phe Leu Thr ser Leu Leu lie Leu val Gin 
3560 3565 3570 

Ser Thr Gin Trp ser Leu Phe Phe Phe Val Tyr Glu Asn Ala Phe 
3575 3580 3585 

Leu Pro Phe Thr Leu Gly lie Met Ala lie Ala Ala cys Ala Met 
3590 3595 3600 

Leu Leu val Lys His Lys His Ala Phe Leu cys Leu Phe Leu Leu 
3605 3610 3615 

Pro ser Leu Ala Thr Val Ala Tyr Phe Asn Met Val Tyr Met Pro 
3620 3625 3630 

Ala ser Trp val Met Arg lie Met Thr Trp Leu Glu Leu Ala Asp 
3635 3640 3645 

Thr ser Leu ser Gly Tyr Arg Leu Lys Asp cys val Met Tyr Ala 
3650 3655 3660 
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ser Ala Leu val Leu Leu lie Leu Met Thr Ala Arg Thr val Tyr 
3665 3670 3675 

Asp Asp Ala Ala Arg Arg Val Trp Thr Leu Met Asn Val lie Thr 
3680 3685 3690 

Leu val Tyr Lys val Tyr Tyr Gly Asn Ala Leu Asp Gin Ala He 
3695 3700 3705 

Ser Met Trp Ala Leu Val lie Ser Val Thr Ser Asn Tyr Ser Gly 
3710 3715 3720 

Val Val Thr Thr He Met Phe Leu Ala Arg Ala lie Val Phe Val 
3725 3730 3735 

cys val Glu Tyr Tyr Pro Leu Leu Phe lie Thr Gly Asn Thr Leu 
3740 3745 3750 

Gin cys lie Met Leu val Tyr cys Phe Leu Gly Tyr cys cys cys 
3755 3760 3765 

cys Tyr Phe Gly Leu Phe cys Leu Leu Asn Arg Tyr Phe Arg Leu 
3770 3775 3780 

Thr Leu Gly val Tyr Asp Tyr Leu val ser Thr Gin Glu Phe Arg 
3785 3790 3795 

Tyr Met Asn Ser Gin Gly Leu Leu Pro Pro Lys Ser Ser lie Asp 
3800 3805 3810 

Ala Phe Lys Leu Asn lie Lys Leu Leu Gly lie Gly Gly Lys pro 
3815 3820 3825 

cys lie Lys val Ala Thr val Gin ser Lys Met ser Asp val Lys 
3830 3835 3840 

cys Thr ser Val val Leu Leu ser val Leu Gin Gin Leu Arg Val 
3845 3850 3855 

Glu ser ser Ser Lys Leu Trp Ala Gin cys Val Gin Leu His Asn 
3860 3865 3870 

Asp He Leu Leu Ala Lys Asp Thr Thr Glu Ala Phe Glu Lys Met 
3875 3880 3885 

Val ser Leu Leu ser val Leu Leu ser Met Gin Gly Ala val Asp 
3890 3895 3900 

lie Asn Arg Leu cys Glu Glu Met Leu Asp Asn Arg Ala Thr Leu 
3905 3910 3915 
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Gin Ala lie Ala ser Glu Phe ser ser Leu Pro ser Tyr Ala Ala 
3920 3925 3930 

Tyr Ala Thr Ala Gin Glu Ala Tyr Glu Gin Ala Val Ala Asn Gly 
3935 3940 3945 

Asp Ser Glu val Val Leu Lys Lys Leu Lys Lys ser Leu Asn Val 
3950 3955 3960 

Ala Lys ser Glu Phe Asp Arg Asp Ala Ala Met Gin Arg Lys Leu 
3965 3970 3975 

Glu Lys Met Ala Asp Gin Ala Met Thr Gin Met Tyr Lys Gin Ala 
3980 3985 3990 

Arg ser Glu Asp Lys Arg Ala Lys val Thr ser Ala Met Gin Thr 
3995 4000 4005 

Met Leu Phe Thr Met Leu Arg Lys Leu Asp Asn Asp Ala Leu Asn 
4010 4015 4020 

Asn lie lie Asn Asn Ala Arg Asp Gly cys Val Pro Leu Asn lie 
4025 4030 4035 

lie Pro Leu Thr Thr Ala Ala Lys Leu Met Val Val Val Pro Asp 
4040 4045 4050 

Tyr Gly Thr Tyr Lys Asn Thr cys Asp Gly Asn Thr Phe Thr Tyr 
4055 4060 4065 

Ala Ser Ala Leu Trp Glu lie Gin Gin Val Val Asp Ala Asp Ser 
4070 4075 4080 

Lys lie val Gin Leu ser Glu lie Asn Met Asp Asn ser Pro Asn 
4085 4090 4095 

Leu Ala Trp Pro Leu He Val Thr Ala Leu Arg Ala Asn Ser Ala 
4100 4105 4110 

Val Lys Leu Gin Asn Asn Glu Leu ser Pro Val Ala Leu Arg Gin 
4115 4120 4125 

Met ser cys Ala Ala Gly Thr Thr Gin Thr Ala cys Thr Asp Asp 
4130 4135 4140 

Asn Ala Leu Ala Tyr Tyr Asn Asn Ser Lys Gly Gly Arg Phe Val 
4145 4150 4155 

Leu Ala Leu Leu ser Asp His Gin Asp Leu Lys Trp Ala Arg Phe 
4160 4165 4170 
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Pro Lys ser Asp Gly Thr Gly Thr lie Tyr Thr Glu Leu Glu Pro 
4175 4180 4185 

Pro cys Arg Phe val Thr Asp Thr Pro Lys Gly Pro Lys Val Lys 
4190 4195 4200 

Tyr Leu Tyr Phe He Lys Gly Leu Asn Asn Leu Asn Arg Gly Met 
4205 4210 4215 

Val Leu Gly ser Leu Ala Ala Thr val Arg Leu Gin Ala Gly Asn 
4220 4225 ~ 4230 

Ala Thr Glu Val Pro Ala Asn Ser Thr Val Leu ser Phe Cys Ala 
4235 4240 4245 

Phe Ala Val Asp Pro Ala Lys Ala Tyr Lys Asp Tyr Leu Ala Ser 
4250 4255 4260 

Gly Gly Gin Pro lie Thr Asn Cys Val Lys Met Leu Cys Thr His 
4265 4270 4275 

Thr Gly Thr Gly Gin Ala lie Thr val Thr Pro Glu Ala Asn Met 
4280 4285 4290 

Asp Gin Glu ser Phe Gly Gly Ala Ser Cys cys Leu Tyr Cys Arg 
4295 4300 4305 

Cys His lie Asp His Pro Asn Pro Lys Gly Phe cys Asp Leu Lys 
4310 4315 4320 

Gly Lys Tyr val Gin lie Pro Thr Thr cys Ala Asn Asp Pro val 
4325 4330 4335 

Gly Phe Thr Leu Arg Asn Thr val cys Thr val cys Gly Met Trp 
4340 " 4345 4350 

Lys Gly Tyr Gly cys ser cys Asp Gin Leu Arg Glu Pro Leu Met 
4355 4360 4365 

Gin ser Ala Asp Ala ser Thr Phe Leu Asn Gly Phe Ala Val 
4370 4375 4380 

<210> 75 

<211> 2695 

<212> PRT 

<213> CORONAVIRUS 
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<400> 75 

Arg Val cys Gly Val Ser Ala Ala Arg Leu Thr Pro cys Gly Thr Gly 
15 10 15 



Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp lie Tyr Asn Glu Lys 
20 25 30 



val Ala Gly Phe Ala Lys Phe Leu Lys Thr Asn Cys Cys Arg Phe Gin 
35 40 45 



Glu Lys Asp Glu Glu Gly Asn Leu Leu Asp ser Tyr Phe val Val Lys 
50 55 60 



Arg His Thr Met Ser Asn Tyr Gin His Glu Glu Thr lie Tyr Asn Leu 
65 70 75 80 



val Lys Asp cys Pro Ala Val Ala val His Asp Phe Phe Lys Phe Arg 
85 90 95 



Val Asp Gly Asp Met val Pro His lie ser Arg Gin Arg Leu Thr Lys 
100 105 110 



Tyr Thr Met Ala Asp Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly 
115 120 ~ 125 



Asn Cys Asp Thr Leu Lys Glu lie Leu Val Thr Tyr Asn Cys cys Asp 
130 135 140 



Asp Asp Tyr Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro 
145 150 155 160 



lie Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gin Ser 
165 170 175 



Leu Leu Lys Thr Val Gin Phe Cys Asp Ala Met Arg Asp Ala Gly lie 
180 185 190 



Val Gly val Leu Thr Leu Asp Asn Gin Asp Leu Asn Gly Asn Trp Tyr 
195 200 205 



Asp Phe Gly Asp Phe Val Gin val Ala Pro Gly cys Gly val Pro He 
210 215 220 



Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro lie Leu Thr Leu Thr Arg 
225 230 235 240 



Ala Leu Ala Ala Glu Ser His Met Asp Ala Asp Leu Ala Lys Pro Leu 
245 250 255 



lie Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr Glu Glu Arg Leu cys 



260 
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Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp Gin Thr Tyr His Pro Asn 
275 280 285 

cys lie Asn Cys Leu Asp Asp Arg Cys lie Leu His cys Ala Asn Phe 
290 295 300 

Asn Val Leu Phe Ser Thr Val Phe Pro Pro Thr Ser Phe Gly Pro Leu 
305 310 315 320 

Val Arg Lys lie Phe Val Asp Gly val Pro Phe Val Val Ser Thr Gly 
325 330 335 

Tyr His Phe Arg Glu Leu Gly Val Val His Asn Gin Asp Val Asn Leu 
340 345 350 

His ser Ser Arg Leu Ser Phe Lys Glu Leu Leu val Tyr Ala Ala Asp 
355 360 365 

Pro Ala Met His Ala Ala ser Gly Asn Leu Leu Leu Asp Lys Arg Thr 
370 375 380 

Thr cys Phe Ser Val Ala Ala Leu Thr Asn Asn val Ala Phe Gin Thr 
385 390 395 400 

val Lys Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala val Ser 
405 410 415 

Lys Gly Phe Phe Lys Glu Gly ser ser val Glu Leu Lys His Phe Phe 
420 425 430 

Phe Ala Gin Asp Gly Asn Ala Ala He Ser Asp Tyr Asp Tyr Tyr Arg 
435 440 445 

Tyr Asn Leu Pro Thr Met cys Asp lie Arg Gin Leu Leu Phe val val 
450 455 ^ 460 

Glu val val Asp Lys Tyr Phe Asp cys Tyr Asp Gly Gly cys lie Asn 
465 470 475 480 

Ala Asn Gin Val lie Val Asn Asn Leu Asp Lys ser Ala Gly Phe Pro 
485 490 495 

Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr Asp ser Met ser Tyr 
500 505 510 

Glu Asp Gin Asp Ala Leu Phe Ala Tyr Thr Lys Arg Asn Val He Pro 
515 ' 520 525 

Thr lie Thr Gin Met Asn Leu Lys Tyr Ala lie ser Ala Lys Asn Arg 
530 535 540 
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Ala Arg Thr Val Ala Gly val ser lie cys ser Thr Met Thr Asn Arg 
545 550 555 560 



Gin Phe His Gin Lys Leu Leu Lys ser lie Ala Ala Thr Arg Gly Ala 
565 570 575 



Thr Val val lie Gly Thr Ser Lys Phe Tyr Gly Gly Trp His Asn Met 
580 585 590 



Leu Lys Thr Val Tyr Ser Asp Val Glu Thr Pro His Leu Met Gly Trp 
595 600 605 



Tyr Pro Lys cys Asp Arg Ala Met Pro Asn Met Leu Arg lie Met 
610 615 620 



Ala ser Leu Val Leu Ala Arg Lys His Asn Thr Cys Cys Asn Leu ser 
625 630 635 640 



His Arg Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gin Val Leu Ser Glu 
645 650 655 



Met val Met cys Gly Gly Ser Leu Tyr val Lys Pro Gly Gly Thr Ser 
660 665 670 



Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser val Phe Asn lie cys 
675 680 685 



Gin Ala Val Thr Ala Asn val Asn Ala Leu Leu Ser Thr Asp Gly Asn 
690 695 700 



Lys He Ala Asp Lys Tyr Val Arg Asn Leu Gin His Arg Leu Tyr Glu 
705 710 715 720 



cys Leu Tyr Arg Asn Arg Asp Val Asp His Glu Phe val Asp Glu Phe 
725 730 735 



Tyr Ala Tyr Leu Arg Lys His Phe ser Met Met lie Leu Ser Asp Asp 
740 745 750 



Ala val Val Cys Tyr Asn ser Asn Tyr Ala Ala Gin Gly Leu Val Ala 
755 760 765 



ser lie Lys Asn Phe Lys Ala Val Leu Tyr Tyr Gin Asn Asn Val Phe 
770 775 780 



Met ser Glu Ala Lys Cys Trp Thr Glu Thr Asp Leu Thr Lys Gly Pro 
785 790 795 800 



His Glu Phe cys ser Gin His Thr Met Leu Val Lys Gin Gly Asp Asp 



805 



810 
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Tyr Val Tyr Leu Pro Tyr Pro Asp Pro Ser Arg lie Leu Gly Ala Gly 
820 825 830 

Cys Phe Val Asp Asp lie Val Lys Thr Asp Gly Thr Leu Met lie Glu 
835 840 845 

Arg Phe val Ser Leu Ala lie Asp Ala Tyr Pro Leu Thr Lys His Pro 
850 855 860 

Asn Gin Glu Tyr Ala Asp val Phe His Leu Tyr Leu Gin Tyr lie Arg 
865 870 875 880 

Lys Leu His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr ser val 
885 890 895 

Met Leu Thr Asn Asp Asn Thr ser Arg Tyr Trp Glu Pro Glu Phe Tyr 
900 905 910 

Glu Ala Met Tyr Thr Pro His Thr Val Leu Gin Ala Val Gly Ala cys 
915 920 925 

val Leu cys Asn Ser Gin Thr Ser Leu Arg cys Gly Ala cys lie Arg 
930 935 940 

Arg Pro Phe Leu cys cys Lys cys cys Tyr Asp His Val lie ser Thr 
945 950 955 960 

ser His Lys Leu val Leu Ser Val Asn Pro Tyr val Cys Asn Ala Pro 
965 970 975 

Gly cys Asp val Thr Asp val Thr Gin Leu Tyr Leu Gly Gly Met Ser 
980 985 990 

Tyr Tyr Cys Lys Ser His Lys Pro Pro lie Ser Phe Pro Leu cys Ala 
995 1000 1005 

Asn Gly Gin val Phe Gly Leu Tyr Lys Asn Thr cys val Gly ser 
1010 1015 1020 

Asp Asn Val Thr Asp Phe Asn Ala lie Ala Thr cys Asp Trp Thr 
1025 1030 1035 

Asn Ala Gly Asp Tyr lie Leu Ala Asn Thr cys Thr Glu Arg Leu 
1040- 1045 1050 

Lys Leu Phe Ala Ala Glu Thr Leu Lys Ala Thr Glu Glu Thr Phe 
1055 1060 1065 

Lys Leu ser Tyr Gly lie Ala Thr Val Arg Glu Val Leu ser Asp 
1070 1075 1080 
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Arg Glu Leu His Leu Ser Trp Glu Val Gly Lys Pro Arg Pro Pro 
1085 1090 1095 

Leu Asn Arg Asn Tyr Val Phe Thr Gly Tyr Arg Val Thr Lys Asn 
1100 1105 1110 

ser Lys Val Gin He Gly Glu Tyr Thr Phe Glu Lys Gly Asp Tyr 
1115 1120 1125 

Gly Asp Ala Val Val Tyr Arg Gly Thr Thr Thr Tyr Lys Leu Asn 
1130 1135 1140 

val Gly Asp Tyr Phe val Leu Thr Ser His Thr Val Met Pro Leu 
1145 * 1150 1155 

ser Ala Pro Thr Leu Val Pro Gin Glu His Tyr Val Arg lie Thr 
1160 1165 1170 

Gly Leu Tyr Pro Thr Leu Asn lie Ser Asp Glu Phe ser Ser Asn 
1175 1180 1185 

Val Ala Asn Tyr Gin Lys val Gly Met Gin Lys Tyr ser Thr Leu 
1190 1195 1200 

Gin Gly Pro Pro Gly Thr Gly Lys Ser His Phe Ala lie Gly Leu 
1205 1210 1215 

Ala Leu Tyr Tyr Pro Ser Ala Arg lie Val Tyr Thr Ala Cys Ser 
1220 1225 1230 

His Ala Ala Val Asp Ala Leu Cys Glu Lys Ala Leu Lys Tyr Leu 
1235 1240 1245 

pro lie Asp Lys cys ser Arg lie lie Pro Ala Arg Ala Arg val 
1250 1255 1260 

Glu cys Phe Asp Lys Phe Lys Val Asn ser Thr Leu Glu Gin Tyr 
1265 1270 1275 

Val Phe Cys Thr Val Asn Ala Leu Pro Glu Thr Thr Ala Asp lie 
1280 1285 1290 

Val Val Phe Asp Glu lie ser Met Ala Thr Asn Tyr Asp Leu Ser 
1295 1300 1305 

Val val Asn Ala Arg Leu Arg Ala Lys His Tyr Val Tyr lie Gly 
1310 " 1315 1320 

Asp Pro Ala Gin Leu Pro Ala Pro Arg Thr Leu Leu Thr Lys Gly 
1325 1330 1335 
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Thr Leu Glu Pro Glu Tyr Phe Asn ser val Cys Arg Leu Met Lys 
1340 1345 1350 

Thr lie Gly Pro Asp Met Phe Leu Gly Thr Cys Arg Arg Cys Pro 
1355 1360 1365 

Ala Glu He val Asp Thr val ser Ala Leu val Tyr Asp Asn Lys 
1370 1375 1380 

Leu Lys Ala His Lys Asp Lys ser Ala Gin cys Phe Lys Met Phe 
1385 1390 1395 

Tyr Lys Gly val lie Thr His Asp val ser ser Ala lie Asn Arg 
1400 1405 1410 

Pro Gin lie Gly Val Val Arg Glu Phe Leu Thr Arg Asn Pro Ala 
1415 1420 1425 

Trp Arg Lys Ala val Phe lie Ser Pro Tyr Asn ser Gin Asn Ala 
1430 1435 1440 

val Ala Ser Lys lie Leu Gly Leu Pro Thr Gin Thr val Asp ser 
1445 1450 1455 

ser Gin Gly ser Glu Tyr Asp Tyr Val lie Phe Thr Gin Thr Thr 
1460 1465 1470 

Glu Thr Ala His Ser Cys Asn Val Asn Arg Phe Asn val Ala lie 
1475 1480 1485 

Thr Arg Ala Lys lie Gly lie Leu Cys lie Met Ser Asp Arg Asp 
1490 1495 1500 

Leu Tyr Asp Lys Leu Gin Phe Thr ser Leu Glu lie Pro Arg Arg 
1505 1510 1515 

Asn Val Ala Thr Leu Gin Ala Glu Asn Val Thr Gly Leu Phe Lys 
1520 1525 1530 

Asp cys ser Lys lie He Thr Gly Leu His Pro Thr Gin Ala Pro 
1535 1540 1545 

Thr His Leu Ser Val Asp lie Lys Phe Lys Thr Glu Gly Leu cys 
1550 1555 1560 

Val Asp lie Pro Gly lie Pro Lys Asp Met Thr Tyr Arg Arg Leu 
1565 1570 1575 

lie ser Met Met Gly Phe Lys Met Asn Tyr Gin Val Asn Gly Tyr 
1580 1585 1590 
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Pro Asn Met Phe lie Thr Arg Glu Glu Ala lie Arg His Val Arg 
1595 1600 1605 

Ala Trp lie Gly Phe Asp val Glu Gly cys His Ala Thr Arg Asp 
1610 1615 1620 

Ala val Gly Thr Asn Leu Pro Leu Gin Leu Gly Phe ser Thr Gly 
1625 1630 1635 

Val Asn Leu val Ala Val pro Thr Gly Tyr Val Asp Thr Glu Asn 
1640 1645 " 1650 

Asn Thr Glu Phe Thr Arg val Asn Ala Lys Pro Pro Pro Gly Asp 
1655 1660 1665 

Gin Phe Lys His Leu lie Pro Leu Met Tyr Lys Gly Leu Pro Trp 
1670 1675 1680 

Asn Val Val Arg lie Lys lie Val Gin Met Leu Ser Asp Thr Leu 
1685 1690 1695 

Lys Gly Leu Ser Asp Arg val Val Phe Val Leu Trp Ala His Gly 
1700 1705 1710 

Phe Glu Leu Thr Ser Met Lys Tyr Phe val Lys lie Gly Pro Glu 
1715 1720 1725 

Arg Thr cys cys Leu Cys Asp Lys Arg Ala Thr cys Phe Ser Thr 
1730 1735 1740 

ser ser Asp Thr Tyr Ala cys Trp Asn His Ser val Gly Phe Asp 
1745 1750 1755 

Tyr Val Tyr Asn Pro Phe Met lie Asp val Gin Gin Trp Gly Phe 
1760 1765 1770 

Thr Gly Asn Leu Gin Ser Asn His Asp Gin His Cys Gin Val His 
1775 1780 1785 

Gly Asn Ala His val Ala Ser Cys Asp Ala lie Met Thr Arg Cys 
1790 1795 1800 

Leu Ala val His Glu cys Phe val Lys Arg val Asp Trp ser val 
1805 1810 1815 

Glu Tyr Pro lie lie Gly Asp Glu Leu Arg val Asn Ser Ala Cys 
1820 1825 1830 

Arg Lys Val Gin His Met Val Val Lys ser Ala Leu Leu Ala Asp 
1835 1840 1845 
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Lys Phe Pro val Leu His Asp lie Gly Asn Pro Lys Ala He Lys 
1850 1855 1860 

cys Val Pro Gin Ala Glu Val Glu Trp Lys Phe Tyr Asp Ala Gin 
1865 1870 1875 

Pro cys Ser Asp Lys Ala Tyr Lys lie Glu Glu Leu Phe Tyr ser 
1880 1885 1890 

Tyr Ala Thr His His Asp Lys Phe Thr Asp Gly Val Cys Leu Phe 
1895 1900 1905 

Trp Asn cys Asn Val Asp Arg Tyr Pro Ala Asn Ala lie val cys 
1910 1915 1920 

Arg Phe Asp Thr Arg Val Leu ser Asn Leu Asn Leu Pro Gly Cys 
1925 ~ 1930 1935 

Asp Gly Gly ser Leu Tyr Val Asn Lys His Ala Phe His Thr Pro 
1940 1945 1950 

Ala Phe Asp Lys ser Ala Phe Thr Asn Leu Lys Gin Leu Pro Phe 
1955 1960 1965 

Phe Tyr Tyr Ser Asp Ser Pro Cys Glu Ser His Gly Lys Gin Val 
1970 1975 1980 

val Ser Asp lie Asp Tyr Val Pro Leu Lys ser Ala Thr Cys lie 
1985 1990 1995 

Thr Arg cys Asn Leu Gly Gly Ala val Cys Arg His His Ala Asn 
2000 2005 2010 

Glu Tyr Arg Gin Tyr Leu Asp Ala Tyr Asn Met Met lie Ser Ala 
2015 2020 2025 

Gly Phe Ser Leu Trp lie Tyr Lys Gin Phe Asp Thr Tyr Asn Leu 
2030 2035 2040 

Trp Asn Thr Phe Thr Arg Leu Gin Ser Leu Glu Asn val Ala Tyr 
2045 2050 2055 

Asn val val Asn Lys Gly His Phe Asp Gly His Ala Gly Glu Ala 
2060 2065 2070 

Pro Val Ser lie lie Asn Asn Ala Val Tyr Thr Lys val Asp Gly 
2075 2080 2085 

lie Asp Val Glu lie Phe Glu Asn Lys Thr Thr Leu Pro val Asn 
2090 2095 2100 
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Val Ala Phe Glu Leu Trp Ala Lys Arg Asn lie Lys Pro Val Pro 
2105 2110 2115 

Glu lie Lys lie Leu Asn Asn Leu Gly val Asp lie Ala Ala Asn 
2120 2125 2130 

Thr Val lie Trp Asp Tyr Lys Arg Glu Ala Pro Ala His val ser 
2135 2140 2145 

Thr lie Gly val Cys Thr Met Thr Asp lie Ala Lys Lys Pro Thr 
2150 2155 2160 

Glu ser Ala cys ser Ser Leu Thr Val Leu Phe Asp Gly Arg Val 
2165 2170 2175 

Glu Gly Gin Val Asp Leu Phe Arg Asn Ala Arg Asn Gly val Leu 
2180 2185 2190 

lie Thr Glu Gly ser val Lys Gly Leu Thr Pro ser Lys Gly Pro 
2195 2200 2205 

Ala Gin Ala Ser Val Asn Gly val Thr Leu lie Gly Glu Ser Val 
2210 2215 2220 

Lys Thr Gin Phe Asn Tyr Phe Lys Lys Val Asp Gly lie lie Gin 
2225 2230 2235 

Gin Leu Pro Glu Thr Tyr Phe Thr Gin ser Arg Asp Leu Glu Asp 
2240 2245 2250 

Phe Lys Pro Arg ser Gin Met Glu Thr Asp Phe Leu Glu Leu Ala 
2255 2260 2265 

Met Asp Glu Phe lie Gin Arg Tyr Lys Leu Glu Gly Tyr Ala Phe 
2270 2275 2280 

Glu His lie Val Tyr Gly Asp phe ser His Gly Gin Leu Gly Gly 
2285 2290 2295 

Leu His Leu Met lie Gly Leu Ala Lys Arg ser Gin Asp Ser Pro 
2300 2305 2310 

Leu Lys Leu Glu Asp Phe lie Pro Met Asp Ser Thr Val Lys Asn 
2315 2320 2325 

Tyr Phe lie Thr Asp Ala Gin Thr Gly ser ser Lys cys Val cys 
2330 2335 2340 

Ser val lie Asp Leu Leu Leu Asp Asp Phe val Glu lie lie Lys 
2345 2350 2355 
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ser Gin Asp Leu ser Val lie Ser Lys Val val Lys Val Thr lie 
2360 2365 2370 

Asp Tyr Ala Glu He ser Phe Met Leu Trp cys Lys Asp Gly His 
2375 2380 2385 

Val Glu Thr Phe Tyr Pro Lys Leu Gin Ala Ser Gin Ala Trp Gin 
2390 2395 2400 

Pro Gly Val Ala Met Pro Asn Leu Tyr Lys Met Gin Arg Met Leu 
2405 2410 2415 

Leu Glu Lys cys Asp Leu Gin Asn Tyr Gly Glu Asn Ala Val lie 
2420 2425 2430 

Pro Lys Gly lie Met Met Asn Val Ala Lys Tyr Thr Gin Leu cys 
2435 2440 2445 

Gin Tyr Leu Asn Thr Leu Thr Leu Ala Val Pro Tyr Asn Met Arg 
2450 2455 2460 

val lie His Phe Gly Ala Gly ser Asp Lys Gly val Ala Pro Gly 
2465 2470 2475 

Thr Ala val Leu Arg Gin Trp Leu Pro Thr Gly Thr Leu Leu Val 
2480 2485 2490 

Asp ser Asp Leu Asn Asp Phe Val ser Asp Ala Asp Ser Thr Leu 
2495 2500 2505 

lie Gly Asp cys Ala Thr val His Thr Ala Asn Lys Trp Asp Leu 
2510 2515 2520 

lie lie Ser Asp Met Tyr Asp Pro Arg Thr Lys His Val Thr Lys 
2525 2530 2535 

Glu Asn Asp ser Lys Glu Gly Phe Phe Thr Tyr Leu cys Gly Phe 
2540 2545 2550 

lie Lys Gin Lys Leu Ala Leu Gly Gly Ser lie Ala Val Lys lie 
2555 2560 2565 

Thr Glu His ser Trp Asn Ala Asp Leu Tyr Lys Leu Met Gly His 
2570 2575 2580 

Phe ser Trp Trp Thr Ala Phe val Thr Asn Val Asn Ala ser Ser 
2585 2590 2595 

ser Glu Ala Phe Leu lie Gly Ala Asn Tyr Leu Gly Lys Pro Lys 
2600 2605 2610 
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Glu Gin He Asp Gly Tyr Thr Met His Ala Asn Tyr lie Phe Trp 
2615 2620 2625 

Arg Asn Thr Asn Pro lie Gin Leu Ser Ser Tyr Ser Leu Phe Asp 
2630 2635 2640 

Met ser Lys Phe Pro Leu Lys Leu Arg Gly Thr Ala Val Met Ser 
2645 2650 ~ 2655 

Leu Lys Glu Asn Gin lie Asn Asp Met lie Tyr Ser Leu Leu Glu 
2660 2665 2670 

Lys Gly Arg Leu lie lie Arg Glu Asn Asn Arg val Val val ser 
2675 2680 2685 

Ser Asp lie Leu Val Asn Asn 
2690 2695 

<210> 76 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L3/+/4932 

<400> 76 

ccacacacag cttgtggata 20 

<210> 77 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L4/+/6401 
<400> 77 

ccgaagttgt aggcaatgtc 20 

<210> 78 
<211> 20 
<212> DNA 
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<213> Artificial sequence 



<220> 

<223> amorce S/L4/+/6964 

<400> 78 

tttggtgctc cttcttattg 20 

<210> 79 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L4/-/6817 

<400> 79 

ccggcatcca aacataattt 20 

<210> 80 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L5/-/7633 

<400> 80 

tggtcagtag ggttgattgg 20 

<210> 81 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> S/L5/-/8127 
<400> 81 

catcctttgt gtcaacatcg 20 
<210> 82 



Page 117 



WO 2005/056584 



PC17FR2004/003106 



S226CAS108.ST25 

<211> 20 
<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L5/-/8633 
<400> 82 

gtcacgagtg acaccatcct 20 

<210> 83 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L5/+/7839 
<400> 83 

atgcgacgag tctgcttcta 20 

<210> 84 

<2U> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L5/+/8785 

<400> 84 

ttcatagtgc ctggcttacc 20 

<210> 85 
<211> 20 
<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L5/+/8255 
<400> 85 

atcttggcgc atgtattgac 20 
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<210> 86 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L6/-/9422 

<400> 86 

tgcattagca gcaacaacat 

<210> 87 

<211> 20 

<212> DNA 

<213> Arti f i ci al sequence 
<220> 

<223> amorce S/L6/-/9966 

<400> 87 

tctgcagaac agcagaagtg 

<210> 88 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L6/-/10542 

<400> 88 

cctgtgcagt ttgtctgtca 

<210> 89 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 
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20 



20 



20 



Page 119 



WO 2005/056584 



PCT7FR2004/003106 



<223> amorce S/L6/+/10677 



S226CAS108.ST25 



<400> 89 

ccttgtggca atgaagtaca 20 

<210> 90 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L6/+/10106 

<400> 90 

atgtcatttg cacagcagaa 20 

<210> 91 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L6/+/9571 

<400> 91 

cttcaatggt ttgccatgtt 20 

<210> 92 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L7/-/11271 

<400> 92 

tgcgagctgt catgagaata 20 

<210> 93 
<211> 20 
<212> DNA 

<213> Artificial sequence 
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<220> 

<223> amorce S/L7/-/11801 

<400> 93 

aaccgagagc agtaccacag 

<210> 94 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L7/-/12383 

<400> 94 

tttggctgct gtagtcaatg 

<210> 95 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L7/+/12640 

<400> 95 

ctacgacaga tgtcctgtgc 

<210> 96 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L7/+/12088 

<400> 96 

gagcaggctg tagctaatgg 

<210> 97 

<211> 20 



PCT/FR2004/003106 
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20 



20 



20 



20 
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<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L7/+/H551 
<400> 97 

ttaggctatt gttgctgctg 20 

<210> 98 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L8/-/13160 

<400> 98 

cagacaacat gaagcaccac 20 

<210> 99 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L8/-/13704 

<400> 99 

cgctgacgtg atatatgtgg 20 

<210> 100 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L8/-/14284 

<400> 100 

tgcacaatga aggatacacc 20 
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<210> 101 
<211> 20 
<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L8/+/14453 
<400> 101 

acatagctcg cgtctcagtt 20 

<210> 102 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L8/+/13968 

<400> 102 

ggcattgtag gcgtactgac 20 

<210> 103 

<211> 19 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L8/+/13401 

<400> 103 

gtttgcggtg taagtgcag 19 

<210> 104 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L9/-/15098 
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<400> 104 

tagtggcggc tattgacttc 

<210> 105 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L9/-/15677 

<400> 105 

ctaaaccttg agccgcatag 

<210> 106 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L9/-/16247 

<400> 106 

catggtcata gcagcacttg 

<210> 107 

<211> 21 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L9/+/16323 

<400> 107 

ccaggttgtg atgtcactga t 

<210> 108 

<211> 20 

<212> DNA 

<213> Artificial sequence 



PCT7FR2004/003106 

S226CAS108.ST25 

20 



20 



20 



21 
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<220> 

<223> amorce S/L9/+/15858 

<400> 108 

ccttacccag atccatcaag 

<210> 109 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L9/+/15288 

<400> 109 

cgcaaacata acacttgctg 

<210> 110 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L10/-/16914 

<400> 110 

agtgttgggt acaagccagt 

<210> 111 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L10/-/17466 

<400> 111 

gttccaagga acatgtctgg 

<210> 112 

<211> 20 

<212> DNA 
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20 



20 



20 



20 
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<213> Artificial sequence 
<220> 

<223> amorce S/L10/-/18022 
<400> 112 

aggtgcctgt gtaggatgaa 20 

<210> 113 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L10/+/18245 

<400> 113 

gggctgtcat gcaactagag 20 

<210> 114 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L10/+/17663 

<400> 114 

tcttacacgc aatcctgctt 20 

<210> 115 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L10/+/17061 

<400> 115 

tacccatctg ctcgcatagt 20 



<210> 116 
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<211> 20 
<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L11/-/18877 

<400> 116 

gcaagcagaa ttaaccctca 20 

<210> 117 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L11/-/19396 

<400> 117 

agcaccacct aaattgcatc 20 

<210> 118 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L11/-/20002 

<400> 118 

tggtcccttt gaaggtgtta 20 

<210> 119 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L11/+/20245 
<400> 119 

tcgaacacat cgtttatgga 20 
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<210> 120 
<211> 20 
<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L11/+/19611 

<400> 120 

gaagcacctg tttccatcat 

<210> 121 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L11/+/19021 

<400> 121 

acgatgctca gccatgtagt 

<210> 122 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L1/F3/+/800 

<400> 122 

gaggtgcagt cactcgctat 

<210> 123 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 
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20 



20 



20 
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<223> amorce SARS/L1/F4/+/1391 
<400> 123 

cagagattgg acctgagcat 20 

<210> 124 

<211> 20 

<212> DNA 

<213:> Artificial sequence 
<220> 

<223> amorce SARS/L1/F5/+/1925 

<400> 124 

cagcaaacca ctcaattcct 20 

<210> 125 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L1/R3/-/1674 

<400> 125 

aaatgatggc aacctcttca 20 

<210> 126 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L1/R4/-/1107 

<400> 126 

cacgtggttg aatgactttg 20 

<210> 127 
<211> 20 
<212> DNA 

<213> Artificial sequence 
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<220> 

<223> amorce SARS/L1/R5/-/520 
<400> 127 

atttctgcaa ccagctcaac ^ 

<210> 128 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L2/F3/+/2664 

<400> 128 

cgcattgtct cctggtttac ^ u 

<210> 129 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L2/F4/+/3232 

<400> 129 _ n 
gagattgagc cagaaccaga zu 

<210> 130 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L2/F5/+/3746 

<400> 130 _ n 
atgagcaggt tgtcatggat ^ u 



<210> 131 
<211> 20 
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<212> ON A 

<213> Artificial sequence 



<220> 

<223> amorce SARS/L2/R3/-/3579 

<400> 131 20 
ctgccttaag aagctggatg 

<210> 132 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L2/R4/-/2991 

<400> 132 20 
tttcttcacc agcatcatca 

<210> 133 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SARS/L2/R5/-/2529 

<400> 133 20 
caccgttctt gagaacaacc 

<210> 134 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SARS/L3/F3/+/4708 

<400> 134 20 
tctttggctg gctcttacag 
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<210> 135 S226CAS108.ST25 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SRAS/L3/F4/+/5305 
<400> 135 

gctggtgatg ctgctaactt 

<210> 136 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L3/F5/+/5822 

<400> 136 

ccatcaagcc tgtgtcgtat 

<210> 137 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L3/R3/-/5610 

<400> 137 

caggtggtgc agacatcata 

<210> 138 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L3/R4/-/4988 
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<400> 138 

aacatcagca ccatccaagt 20 

<210> 139 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SARS/L3/R5/-/4437 

<400> 139 

atcggacacc atagtcaacg 20 

<210> 140 

<211> 7788 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> gene S synthetique 
<400> 140 

tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60 

ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120 

aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180 

gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240 

gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300 

agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360 

ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420 

cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480 

gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac 540 

caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 600 

caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaataaccc 660 

cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 720 

tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc acagttaaat 780 

tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca gaagttggtc 840 

gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag accaatagaa 900 

actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta ttggtcttac 960 
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tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt acagctctta 1020 

aggctagagt acttaatacg actcactata ggctagcgga tccaccatgt tcatcttcct 1080 

gctgttcctg accctgacca gcggcagcga cctggaccgg tgcaccacct tcgacgacgt 1140 

gcaggccccc aactacaccc agcacaccag cagcatgcgg ggcgtgtact accccgacga 1200 

gatctttcgg agcgacaccc tgtacctgac ccaggacctg ttcctgccct tctacagcaa 1260 

cgtgaccggc ttccacacca tcaaccacac cttcggcaac cccgtgatcc ccttcaagga 1320 

cggcatctac ttcgccgcca ccgagaagag caacgtggtg cggggctggg tgttcggcag 1380 

caccatgaac aacaagagcc agagcgtgat catcatcaac aacagcacca acgtggtgat 1440 

ccgggcctgc aacttcgagc tgtgcgacaa ccccttcttc gccgtgtcca aacccatggg 1500 

cacccagacc cacaccatga tcttcgacaa cgccttcaac tgcaccttcg agtacatcag 1560 

cgacgccttc agcctggacg tgagcgagaa gagcggcaac ttcaagcacc tgcgggagtt 1620 

cgtgttcaag aacaaggacg gcttcctgta cgtgtacaag ggctaccagc ccatcgacgt 1680 

ggtgagagac ctgcccagcg gcttcaacac cctgaagccc atcttcaagc tgcccctggg 1740 

catcaacatc accaacttcc gggccatcct gaccgccttt agccctgccc aggacatctg 1800 

gggcaccagc gccgccgcct acttcgtggg ctacctgaag cctaccacct tcatgctgaa 1860 

gtacgacgag aacggcacca tcaccgacgc cgtggactgc agccagaacc ccctggccga 1920 

gctgaagtgc agcgtgaaga gcttcgagat cgacaagggc atctaccaga ccagcaactt 1980 

cagagtggtg cctagcggcg atgtggtgcg gttccccaat atcaccaacc tgtgcccctt 2040 

cggcgaagtg ttcaacgcca ccaagttccc cagcgtgtac gcctgggagc ggaagaagat 2100 

cagcaactgc gtggccgact acagcgtgct gtacaactcc accttcttca gcaccttcaa 2160 

gtgctacggc gtgagcgcca ccaagctgaa cgacctgtgc ttcagcaacg tgtacgccga 2220 

cagcttcgtg gtgaagggcg acgacgtgag acagatcgcc cctggccaga ccggcgtgat 2280 

cgccgactac aactacaagc tgcccgacga cttcatgggc tgcgtgctgg cctggaacac 2340 

ccggaacatc gacgccacaa gcaccggcaa ctacaattac aagtaccgct acctgcggca 2400 

cggcaagctg cggcccttcg agcgggacat ctccaacgtg cccttcagcc ccgacggcaa 2460 

gccctgcacc ccccctgccc tgaactgcta ctggcccctg aacgactacg gcttctacac 2520 

caccaccggc atcggctatc agccctacag agtggtggtg ctgagcttcg agctgctgaa 2580 

cgcccctgcc accgtgtgcg gccccaagct gagcaccgac ctgatcaaga accagtgcgt 2640 

gaacttcaac ttcaacggcc tgaccggcac cggcgtgctg acccccagca gcaagcgctt 2700 

ccagcccttc cagcagttcg gccgggatgt gagcgacttc accgacagcg tgcgggaccc 2760 

caagaccagc gagatcctgg acatcagccc ctgcagcttc ggcggcgtgt ccgtgatcac 2820 

ccccggcacc aacgccagca gcgaagtggc cgtgctgtac caggacgtga actgcaccga 2880 

cgtgagcacc gccatccacg ccgaccagct gacccccgcc tggcggatct acagcaccgg 2940 

gaacaacgtg ttccagaccc aggccggctg cctgatcggc gccgagcacg tggacaccag 3000 
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ctacgagtgc 


gacatcccca 


ttggcgccgg 


aatctgcgcc 


agctaccaca 


ccgtgagcct 


3060 


gctgcggagc 


accagccaga 


agtccatcgt 


ggcctacacc 


atgagcctgg 


gcgccgacag 


3120 


cagcatcgcc tacagcaaca 


acaccatcgc 


catccccacc 


aacttcagca 


tctccatcac 


3180 


caccgaagtg 


atgcccgtga 


gcatggccaa 


gacaagcgtg 


gattgcaaca 


tgtacatctg 


3240 


cggcgacagc 


accgagtgcg 


ccaacctgct 


gctgcagtac 


ggcagcttct 


gcacccagct 


3300 


gaaccgggcc 


ctgagcggca 


tcgccgccga 


gcaggaccgg 


aacaccagag 


aagtgttcgc 


3360 


ccaagtgaag 


cagatgtata 


agacccccac 


cctgaagtac 


ttcgggggct 


tcaacttctc 


3420 


tcagatcctg 


cccgaccctc 


tgaagcccac 


caagcgctcc 


ttcatcgagg 


acctgctgtt 


3480 


caacaaagtg accctggccg 


acgccggctt 


tatgaagcag 


tacggcgagt 


gcctgggcga 


3540 


catcaacgcc 


cgggacctga 


tctgcgccca 


gaagtttaac 


gggctgaccg 


tgctgccccc 


3600 


cctgctgacc gacgacatga 


tcgccgccta 


tacagccgcc 


ctggtgagcg 


gcaccgccac 


3660 


cgccggctgg 


accttcggag 


ccggagccgc 


cctgcagatc 


cccttcgcca 


tgcagatggc 


3720 


ctaccggttc 


aacggcatcg 


gcgtgaccca 


gaacgtgctg 


tacgagaacc 


agaagcagat 


3780 


cgccaaccag 


ttcaacaagg 


ccatcagcca 


gatccaggag 


agcctgacca 


caaccagcac 


3840 


cgccctgggc 


aagctgcagg 


acgtggtgaa 


ccagaacgcc 


caggccctga 


acaccctggt 


3900 


gaagcagctg 


agcagcaact 


tcggcgccat 


cagctctgtg 


ctgaacgaca 


tcctgagcag 


3960 


gctggacaaa 


gtggaggccg 


aagtgcagat 


cgaccggctg 


atcaccggac 


gcctgcagtc 


4020 


cctgcagacc 


tacgtgaccc 


agcagctgat 


cagagccgcc 


gagatccggg 


ccagcgccaa 


4080 


tctggccgcc 


accaagatga 


gcgagtgcgt 


gctgggccag 


agcaagagag 


tggacttctg 


4140 


cggcaagggc 


tatcacctga 


tgagcttccc 


ccaggccgcc 


ccccacggcg 


tggtgttcct 


4200 


gcacgtgacc 


tacgtgccta 


gccaggagcg 


gaacttcacc 


accgccccag 


ccatctgcca 


4260 


cgagggcaag 


gcctacttcc 


cccgggaggg 


cgtgttcgtg 


tttaacggca 


ccagctggtt 


4320 


catcacccag 


cgcaacttct 


tcagccccca 


gatcatcacc 


acagacaaca 


ccttcgtgtc 


4380 


cggcaactgt 


gatgtggtga 


tcggcatcat 


caataacacc 


gtgtacgacc 


ccctgcagcc 


4440 


cgagctggac agcttcaagg 


aggagctgga 


caaatacttc 


aagaaccaca 


cctcccccga 


4500 


cgtggacctg 


ggcgatatca 


gcggcatcaa 


cgcctccgtg 


gtgaacatcc 


agaaggagat 


4560 


cgacagactg aacgaagtgg 


ccaagaacct 


gaacgagagc 


ctgatcgacc 


tgcaggagct 


4620 


gggcaagtac gagcagtaca 


tcaagtggcc 


ctggtacgtg 


tggctgggct 


tcatcgccgg 


4680 


cctgatcgcc atcgtgatgg 


tgaccatcct 


gctgtgctgc 


atgaccagct 


gctgtagctg 


4740 


cctgaaaggc gcctgcagct 


gtggcagctg 


ctgcaagttc 


gacgaggacg 


acagcgagcc 


4800 


cgtgctgaag 


ggcgtgaagc 


tgcactacac 


ctgataactc 


gagaattcac 


gcgtggtacc 


4860 


tctagagtcg 


acccgggcgg 


ccgcttcgag 


cagacatgat 


aagatacatt 


gatgagtttg 


4920 


gacaaaccac 


aactagaatg 


cagtgaaaaa 


aatgctttat 


ttgtgaaatt 


tgtgatgcta 


4980 


ttgctttatt 


tgtaaccatt 


ataagctgca 


ataaacaagt 


taacaacaac 


aattgcattc 


5040 
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attttatgtt tcaggttcag 


ggggagatgt 


gggaggtttt 


ttaaagcaag 


taaaacctct 


5100 


acaaatgtgg taaaatcgat aaggatccgg gctggcgtaa tagcgaagag gcccgcaccg 


5160 


atcgcccttc ccaacagttg 


cgcagcctga atggcgaatg gacgcgccct 


gxagcggcgc 


5220 


attaagcgcg gcgggtgtgg tggttacgcg 


cagcgtgacc gctacacttg 


ccagcgccct 


5280 


dyCgCLLyLL CCItttgLLt 


tcttcccttc 


ctttctcgcc acgttcgccg 


gcxxxccccg 


5340 


4" f a a nr~i~ /■+ a -> , 3+*/~i r inn/~f/nr~ 

xtaayCLLi.a aaxcgggggc. 


tccctttagg 


gttccgattt 


agagctttac 


ggcaccxcga 


5400 


CCyCdddddd CXXgdXLXgg 


gtgatggttc 


acgtagtggg 


ccatcgccct 


gatagacggt 


5460 




agtccacgtt 


ctttaatagt 


ggactcttgt 


xccaaacxgg 


5520 


ddCddCdCLC ddCCCXclXCX 


cggtctattc ttttgattta taagggattt 


xgccgaxxxc 


5580 


nnrrtattnn +"l"3 a a a a a "f^/i 
yyCLUdLLyy LlddddddLg 


agctgattta 


acaaatattt 


aacgcgaatt 


xxaacaaaax 


5640 


attaarnttt araatttrnr 


ctgatgcggt 


attttctcct 


tacgcatctg 


xgcggxaxxt 


5700 


fa. fa. rmrat a1*nni"nrpr1* 
LdV-ctLLyLdL dLyyuyUdt-L 


ctcagtacaa tctgctctga tgccgcatag 


x xaagccagc 


5760 


CCCC\7\C7KCTf CtC f~a a r* a f-r- f 
V_l-t_y av.aLLL yLLaaLaLtL 


gctgacgcgc 


cctgacgggc ttgtctgctc 


ccggcaxccg 


5820 


v_ l LaLayaLa ayu ty LydLv. 


gtctccggga 


gctgcatgtg tcagaggttt 


ICdCCgiCdL 


5880 


v_dv_ t.y aaaiy Lytydydcyd 


aagggcctcg 


tgatacgcct 


atttttatag 


/*i+"+*a a+*^"i+*^"a 

gi laa xg xca 


5940 


+■ n a +• a a +• a a +• nntttrttan 
LyaiaaLaaL yy LLLLLLdy 


acgtcaggtg 


gcacttttcg 


gggaaatgtg 


cgcggaaccc 


6000 


LLaLLLy LLL aLLLLLL Lad 


atacattcaa 


atatgtatcc 


gctcatgaga 


Cdd LddCCC L 


6060 


ydLaaaLyLL LLdaLaalaL 


tgaaaaagga 


agagtatgag 


tattcaacat 


+■ ^ -4— /^i -4— /• 

u xccg xg xcg 


6120 




gcattttgcc 


ttcctgtttt 


tgctcaccca 


gaaacgcxgg 


6180 


Lyaaay Laaa ctyci i_y Ly dd 


gatcagttgg 


gtgcadgagt 


gggttacatc 


y adc xggd lc 


6240 


tcaacagcgg taagatcctt 


gagagttttc 


gccccgaaga 


acgttttcca 


digdigdgcd 


6300 


cttttaaagt tctgctatgt 


ggcgcggtat 


tatcccgtat 


tgacgccggg 


caagagcaac 


6360 


tcggtcgccg catacactat 


tctcagaatg 


acttggttga 


gtactcacca 


gtcacagaaa 


6420 


agcatcttac ggatggcatg 


acagtaagag 


aattatgcag 


tgctgccata 


accatgagtg 


6480 


ataacactgc ggccaactta 


cttctgacaa 


cgatcggagg 


accgaaggag 


ctaaccgctt 


6540 


ttttgcacaa catgggggat 


catgtaactc 


gccttgatcg 


ttgggaaccg 


gagctgaatg 


6600 


aagccatacc aaacgacgag 


cgtgacacca 


cgatgcctgt 


agcaatggca 


acaacgttgc 


6660 


gcaaactatt aactggcgaa 


ctacttactc 


tagcttcccg gcaacaatta atagactgga 


6720 


tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 


6780 


ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 


6840 


cagatggtaa gccctcccgt 


atcgtagtta 


tctacacgac 


ggggagtcag 


gcaactatgg 


6900 


atgaacgaaa tagacagatc 


gctgagatag 


gtgcctcact gattaagcat 


tggtaactgt 


6960 


cagaccaagt ttactcatat 


atactttaga 


ttgatttaaa 


acttcatttt 


taatttaaaa 


7020 


ggatctaggt gaagatcctt tttgataatc tcatgaccaa 


aatcccttaa 


cgtgagtttt 


7080 
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cgttccactg 


agcgtcagac 


cccgtagaaa 


agatcaaagg 


atcttcttga 


gatccttttt 


7140 


ttctgcgcgt 


aatctgctgc 


ttgcaaacaa aaaaaccacc 


gctaccagcg 


gtggtttgtt 


7200 


tgccggatca 


agagctacca 


actctttttc 


cgaaggtaac tggcttcagc agagcgcaga 


7260 


taccaaatac 


tgtccttcta 


gtgtagccgt 


agttaggcca 


ccacttcaag 


aactctgtag 


7320 


caccgcctac 


atacctcgct 


ctgctaatcc 


tgttaccagt 


ggctgctgcc 


agtggcgata 


7380 


agtcgtgtct 


taccgggttg 


gactcaagac 


gatagttacc 


ggataaggcg 


cagcggtcgg 


7440 


gctgaacggg 


gggttcgtgc 


acacagccca gcttggagcg 


aacgacctac 


accgaactga 


7500 


gatacctaca 


gcgtgagcta 


tgagaaagcg 


ccacgcttcc 


cgaagggaga 


aaggcggaca 


7560 


ggtatccggt 


aagcggcagg 


gtcggaacag 


gagagcgcac 


gagggagctt 


ccagggggaa 


7620 


acgcctggta 


tctttatagt 


cctgtcgggt 


ttcgccacct 


ctgacttgag 


cgtcgatttt 


7680 


tgtgatgctc 


gtcagggggg 


cggagcctat 


ggaaaaacgc 


cagcaacgcg 


gcctttttac 


7740 


ggttcctggc 


cttttgctgg 


ccttttgctc 


acatggctcg 


acagatct 




7788 



<210> 141 

<211> 23 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SNE-Sl 

<400> 141 

ggttgggatt atccaaaatg tga 23 

<210> 142 

<211> 24 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SNE-AS1 

<400> 142 

gcatcatcag aaagaatcat catg 24 

<210> 143 

<211> 21 

<212> DNA 
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<213> Artificial sequence 



<220> 

<223> amorce SARl-S 
<400> 143 

cctctcttgt tcttgctcgc a 

<210> 144 

<211> 21 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARl-AS 

<400> 144 

tatagtgagc cgccacacat g 

<210> 145 

<211> 45 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<400> 145 

ataggatcca ccatgtttat tttcttatta tttcttactc tcact 

<210> 146 
<2U> 37 
<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 
<400> 146 

atactcgagt tatgtgtaat gtaatttgac acccttg 
<210> 147 
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<211> 45 
<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce pcr 

<400> 147 

ataggatcca ccatgtttat tttcttatta tttcttactc tcact 45 

<210> 148 

<211> 36 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce PCR 

<400> 148 

acctccggat ttaatatatt gctcatattt tcccaa 

<210> 149 

<211> 13 

<212> PRT 

<213> Artificial sequence 



<220> 

<223> extremity N-terminale de la proteine s du SRAS-coV Cacides amines 
1 a 13) 

<400> 149 

Met Phe lie Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly 
15 10 

<210> 150 

<211> 10 

<212> PRT 

<213> Artificial sequence 



<220> 

<223> oligopeptide 
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<400> 150 

Ser Gly Asp Tyr Lys Asp Asp Asp Asp i_ys 
1 5 10 



<210> 151 

<211> 34 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<400> 151 

actagctagc ggatccacca tgttcatctt cctg 

<210> 152 

<211> 33 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<400> 152 

agtatccgga cttgatgtac tgctcgtact tgc 

<210> 153 

<211> 59 

<212> DNA 

<213> Artificial sequence 



34 



33 



<220> 

<223> oligonucleotide 
<400> 153 

tatgagcttt tttttttttt tttttttggc atataaatag actcggcgcg ccatctgca 59 

<210> 154 
<211> 53 
<212> DNA 

<213> Artificial sequence 
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<220> 

<223> ol i gonucl eoti de 
<400> 154 

gatggcgcgc cgagtctatt tatatgccaa aaaaaaaaaa aaaaaaaagc tea 53 

<210> 155 

<211> 45 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<400> 155 

ataegtaega ccatgtttat tttcttatta tttcttactc tcact 45 

<210> 156 

<211> 40 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<400> 156 

atagegeget cattatgtgt aatgtaattt gacacccttg 40 

<210> 157 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<400> 157 

ccatttcaac aatttggccg 20 

<210> 158 
<211> 45 
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<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce PCR 
<400> 158 

ataggatccg cgcgctcatt atttatcgtc gtcatcttta taatc 45 
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Formulaire I^CT/RO/134 (SAKE) 
Indications relatives a des nfocro- 
organlsmes oifcaut^e mateffel 
biologique deposes (regie 13bls du 
PCT) 

Preparee avec 


PCT- SAFE [EASY mode] 

Version 3.50 (Build 0002.162) 


0-2 


Demande Internationale n° 




0-3 


Reference du dossier du deposant ou 
du mandataire 


VMAcp226-108 




1 

1-1 
1-2 


Les indications cl-dessous ont trait 
au micro-organisme ou autre materiel 
biologique vise dans la description : 

ligne 


31 


1-3 

1-3-1 

1-3-2 

1-3-3 
1-3-4 


identification du depot 
Nom de rinstitution de depot 

Adresse de {'institution de dep6t 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 
micro -organismes 

FR- Institut Pasteur , 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 

CNCM 1-3059 


1-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d^un 
echantillon a un expert designe par le 
requerant . 


1-5 


Etats designes pour lesquels les 
indications sont donnees 


de toutes les designations 


2 

2-1 
2-2 


Les indications ci-dessous ont trait 
au micro-organisme ou autre materiel 
biologique vise dans la description : 
page 

ligne 


12 
6 


2^ 
2-3-1 

2-3-2 

2-3-3 
2-3-4 


Identification du depdt 
Nom de ('institution de depdt 

Adresse de ('institution de depdt 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 
micro-organismes 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 
12 Mai 2003 (12.05.2003) 
CNCM 1-3020 


2-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant. 


2-5 


Etats designes pour lesquels les 
indications sont donnees 


de toutes les designations 
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3 

3-1 
3-2 


Les Indications cl-dessous ont trait 

ail mlrrn-nrnankmp mi antra materiel 

bioiogique vise dans la description : 
page 

llgne 


12 
13 


3-3 
3-3-1 

3-3-2 

3-3-3 
3-3-4 


Identification du depot 
Norn de 1'institution de depdt 

Adresse de ^institution de depot 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 
nucro-orgaiiismes 

FR- Institut Pasteur, 28 , rue du Dr 
Roux, F-75724 Paris Cedex 15 
12 Mai 2003 (12.05.2003) 
CNCM 1-3019 


3-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro -organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant . 


3-5 


Etats design^s pour lesqueis les 
indications sont donnees 


de toutes les designations 


4 

4-1 

4-2 


Les indications ci-dessous ont trait 
au micro-oraanisme ou autre materiel 
bioiogique vise dans la description : 
page 

ligne 


12 
20 


4-3 

4-3-1 

4-3-2 

4-3-3 
4-3-4 


Identification du depdt 
Nom de i'institution de depdt 

Adresse de I'institution de depdt 

Date du depot 
Numero d'ordre 


CNCM Collection nationale de cultures de 

mi c i o — ur^axii Blue 5 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 

13 Novembre 2003 (13.11.2003) 

CNCM 1-3126 


4-4 


indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro -organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant . 


4-5 


Etats dSslgnes pour lesqueis les 
indications sont donnees 


de toutes les designations 
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5 

5-1 
5-2 


Les Indications ci-dessous ont trait 

sin ml pmaMrnsnlemA mi sintm mn t<?» rl o 1 
au lit icr u*ui yai iisiiic uu ouu c kiciicm 1 1; i 

biotogique vise dans (a description : 
page 

ligne 


12 
28 


5-3 
5-3-1 

5-3-2 

5-3-3 
5-3-4 


Identification du depot 
Nom de I'institution de depot 

Adresse de I'institution de depdt 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 
mi c ro - org am sme s 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 

28 Mai 2003 (28.05.2003) 

CNCM 1-3046 


5-4 


indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant. 


5-5 


Etats deslgnes pour lesquels les 
indications sont donnees 


de toutes les designations 


6 

6-1 
6-2 


Les indications ci-dessous ont trait 

an m!rrn*nrnankmp mi antra matArip) 
au 11111*1 u*vi yen hoi i it? um auuc uiaidiei 

biologique vise dans la description : 
page 

ilgne 


13 
4 


6-3 

6-3-1 

6-3-2 

6-3-3 
6-3-4 


Identification du depot 
Nom de I'institution de depot 

Adresse de I'institution de depdt 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 
micro - orgamsmes 

FR- Ins ti tut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 

28 Mai 2003 (28.05.2003) 

CNCM 1-3 047 


6-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant . 


6-5 


Etats deslgnes pour lesquels les 
indications sont donnees 


de toutes les designations 
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7 

7-1 
7-2 


Les indications cl-dessous ont trait 
au micro-organisme ou autre materiel 
biologique vise dans la description : 
page 

ligne 


13 
11 


7-3 

7-3-1 

7-3-2 

7-3-3 
7-3-4 


Identification du depot 
Nom de Institution de depflt 

Adresse de institution de depot 

Date du depot 
Numero d'ordre 


CNCM Collection nationale de cultures de 
nil c ro — o r g am sme s 

FR- Ins ti tut Pasteur, 28 , rue du Dr 
Roux, F-75724 Paris Cedex 15 

13 Novembre 2003 (13. 11, 2003) 

CNCM 1-3125 


7-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesguelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant • 


7-5 


Etats designes pour lesquels les 
Indications sont donnees 


de toutes les designations 


8 

8-1 
8-2 


Les indications ci-dessous ont trait 
au micro-organisme ou autre materiel 
biologique vise dans la description : 
page 

ligne 


13 
19 


8-3 

8-3-1 

8-3-2 

8-3-3 
8-3-4 


identification du depot 
Nom de Pinstitution de depdt 

Adresse de institution de dep6t 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 
mi c ro — or gam sme s 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 

05 Juin 2003 (05.06. 2003) 

CNCM 1-3048 


8-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d»un 
echantillon a un expert designe par le 
requerant . 


8-5 


Etats designes pour lesquels les 
indications sont donnees 


de toutes les designations 
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9 

9-1 
9-2 


Les indications cl-dessous ont trait 
au micro-organ is me ou autre materiel 
biologique vise dans la description : 
page 

ligne 


13 
30 


9-3 

9-3-1 

9-3-2 

9-3-3 
9-3-4 


Identification du depot 
Norn de ['institution de dep6t 

Adresse de restitution de depdt 

Oate du depot 
Numero d'ordre 


CNCM Collection nationale de cultures de 

Tnicrn.oT'rran'i a-m o a 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 

07 Novembre 2003 (07.11.2003) 

CNCM 1-3124 


9-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant. 


9-5 


Etats designes pour tesquels ies 
indications sont donnees 


de toutes les designations 


10 

10-1 
10-2 


Les indications ci-dessous ont trait 
au micro-organ is me ou autre materiel 
biologique vise dans la description : 
page 

ligne 


14 
5 


10-3 

10-3-1 

10-3-2 

10-3-3 
10-3-4 


Identification du depot 
Nom de I'institution de depot 

Adresse de I'institution de depot 

Date du depot 
Numero d'ordre 


CNCM Collection nationale de cultures de 

micro -ofcranismpfi 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 

07 Novembre 2003 (07,11.2003) 

CNCM 1-3123 


10-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant . 


10-5 


Etats designes pour lesquels ies 
indications sont donnees 


de toutes les designations 
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11 
11-1 

11-2 


Les indications cl-dessous ont trait 
ail mlcro-oraanlsme ou autre materiel 
biologique vise dans la description : 
page 

ligne 


15 
5 


11-3 

11-3-1 

11-3-2 

11-3-3 
11-3-4 


Identification du depot 
Nom de Institution de depdt 

Adresse de I'institution de depdt 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 
mi. c ro - o rgam sine s 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 

23 Octobre 2003 (23.10.2003) 

CNCM 1-3117 


11-4 


indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro -organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant . 


11-5 


Etats deslgnes pour lesquels les 
indications sont donnees 


de toutes les designations 


12 

12-1 
12-2 


Les Indications cl-dessous ont trait 
au micro-oraanlsme ou autre materiel 
biologique vise dans la description : 
page 

ligne 


15 
9 


12-3 

12-3-1 

12-3-2 

12-3-3 
12-3-4 


Identification du depdt 

Nom de institution de depot 

Adresse de Pinstitution de depot 

Date du depot 
Numero d'ordre 


CNCM Collection nationale de cultures de 
mi c r o - o r gam sme s 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 
23 Octobre 2003 (23.10.2003) 
CNCM 1-3118 


12-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant . 


12-5 


Etats deslgnes pour lesquels les 
indications sont donnees 


de toutes les designations 
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13 

13-1 
13-2 


Les Indications ci-dessous ont trait 

an mlrrn-nrnsnkmp nil autre mat£rlpl 
aw iiiivi yal iioiiiv \jkm nunc ihciiciici 

blologique vise dans la description : 
page 

ligne 


15 
18 


13-3 
13-3-1 

13-3-2 

13-3-3 
13-3-4 


Identification du depot 

Nom de restitution de depdt 

Adresse de restitution de depdt 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 

111 X W JLU — UJu^allJ. DlllG & 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 
22 Novembre 2004 (22.11,2004) 
CNCM 1-3323 


13-4 


indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant. 


13-5 


Etats deslgnes pour lesquels les 
Indications sont donnees 


de toutes les designations 


14 

14-1 
14-2 


Les indications cl-dessous ont trait 
au micro-organ Is me ou autre materiel 
biologlque vise dans la description : 
page 

ligne 


15 
19 


14-3 
14-3-1 

14-3-2 

14-3-3 
14-3-4 


Identification du depot 
Nom de restitution de depot 

Adresse de I'institution de depdt 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 

IUICIO — UX. y Clli J. C)ltLt= ts 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 
22 Novembre 2004 (22.11.2004) 
CNCM 1-3324 


14-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant. 


14-5 


Etats deslgnes pour lesquels les 
indications sont donnees 


de toutes les designations 
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15 

15-1 
15-2 


Les Indications ci-dessous ont trait 
du rnicro-orgariisrne ou autre rnaienei 
biologlque vise dans la description : 
page 

ligne 


17 
27 


15-3 

15-3-1 

15-3-2 

15-3-3 
15-3-4 


Identification du depot 
Norn de ('institution de dep6t 

Adresse de institution de depot 

Date du depot 
Numero d'ordre 


CNCM Collection nationale de cultures de 
mi. c ro - organisme s 

FR- Ins ti tut Pasteur, 28, rue du Dr 
Roux, F- 7 57 2 4 Paris Cedex 15 
22 Novembre 2004 (22-11.2004) 
CNCM 1-3325 


15-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro -organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant . 


15-5 


Etats designee pour lesquels (es 
indications sont donnees 


de toutes les designations 


16 

16-1 
16-2 


Les indications ci-dessous ont trait 

bloiogique vise dans la description : 
page 

ligne 


15 
20 


16-3 

16-3-1 

16-3-2 

16-3-3 
16-3-4 


Identification du depot 
Norn de I'institution de depot 

Adresse de ('institution de dep6t 

Date du dep6t 
Numero d'ordre 


CNCM Collection nationale de cultures de 
mi c r o - o r gam sine s 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 
01 Decembre 2004 (01.12.2004) 
CNCM 1-3326 


16-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro -organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant . 


16-5 


Etats designes pour lesquels ies 
indications sont donnees 


de toutes les designations 
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17 

17-1 
17-2 


Les Indications ci-dessous ont trait 

au micro-ora^nlsma mi autre materiel 

bioiogique vise dans la description : 
page 

Hgne 


15 
21 


17-3 
17-3-1 

17-3-2 

17-3-3 
17-3-4 


Identification du dep6t 
Norn de ['institution de depdt 

Adresse de (Institution de depot 

Date du depot 
Numero d'ordre 


CNCM Collection nationale de cultures de 
micro — organisiues 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 
01 Decembre 2004 (01.12.2004) 
CNCM 1-3327 


17-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro -organisme depose ne sera 
accessible que par la remise d v un 
echantillon a un expert designe par le 
requerant . 


17-5 


Etats desfgnes pour lesquels les 
indications sont donnees 


de toutes les designations 


18 

18-1 
18-2 


Les indications cl-dessous ont trait 
au micro-organ Isme ou autre materiel 
bioiogique vise dans la description : 
page 

ligne 


19 
28 


18-3 

18-3-1 

18-3-2 

18-3-3 
18-3-4 


Identification du depot 
Norn de I'instltution de depot 

Adresse de I'instltution de depot 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 

01 Decembre 2004 (01.12.2004) 

CNCM 1-3328 


18-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro -organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant. 


18-5 


Etats designes pour lesquels les 
indications sont donnees 


de toutes les designations 
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19 

19-1 
19-2 


Les Indications ci-dessous ont trait 
au micro-organisme ou autre materiel 
biologlque vise dans la description : 
page 

Hgne 


19 
30 


19-3 

19-3-1 

19-3-2 

19-3-3 
19-3-4 


Identification du depot 
Nom de ('institution de depdt 

Adresse de Pinstitution de depdt 

Date du depot 
Numero d'ordre 


CNCM Collection nationale de cultures de 
nix c iro - oryani sme s 

FR- Institut Pasteur/ 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 
01 Decembre 2004 (01.12.2004) 
CNCM 1-3329 


19-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
re que rant . 


19-5 


Etats designes pour lesquels les 
Indications sont donnees 


de toutes les designations 


20 

20-1 
20-2 


Les indications ci-dessous ont trait 
au mlcro-oraanisme ou autre materiel 
biologlque vise dans la description : 
page 

ligne 


19 
32 


20-3 
20-3-1 

20-3-2 

20-3-3 
20-3-4 


Identification du depot 
Nom de ^Institution de depdt 

Adresse de ^institution de depdt 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 

uiicio — u i y ctin sine & 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 

01 Decembre 2004 (01.12.2004) 

CNCM 1-3330 


20-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant. 


20-5 


Etats designes pour lesquels les 
indications sont donnees 


de toutes les designations 
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21 

21-1 
21-2 


Les indications ci-dessous ont trait 
au micro-organisme ou autre materiel 
blologlque vise dans ta description : 
page 

Hgne 


20 
2 


21-3 

21-3-1 

21-3-2 

21-3-3 
21-3-4 


identification du depdt 
Nom de I'institution de depot 

Adresse de I'institution de depdt 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 
01 Decembre 2004 (01-12,2004) 
CNCM 1-3331 


21-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demanae , le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant . 


21-5 


Etats designes pour lesquels les 
indications sont donnees 


de toutes les designations 


22 

22-1 
22-2 


Les indications ci-dessous ont trait 
au micro-organisme ou autre materiel 
blologlque vise dans la description : 
page 

ligne 


15 
22 


22-3 
22-3-1 

22-3-2 

22-3-3 
22-3-4 


identification du depot 
Nom de I'institution de depdt 

Adresse de I'institution de depot 

Date du depdt 
Numero d'ordre 


CNCM Collection nationale de cultures de 

Tnif t*o — nTnan "L sine s 

FR- Institut Pasteur, 28 , rue du Dr 
Roux, F-75724 Paris Cedex 15 
01 Decembre 2004 (01.12.2004) 
CNCM 1-3332 


22-4 


Indications supplementaires 


En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant. 


22-5 


Etats designes pour lesquels (es 
indications sont donnees 


de toutes les designations 
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23 


Les indications ci-dessous ont trait 

mi mlcrnaArnanlQino on antra material 

biologique vis§ dans la description : 




23-1 


page 


15 


23-2 


llgne 


23 


23-3 


Identification du depdt 




23-3-1 


Nom de ('institution de depdt 


CNCM Collection nationale de cultures de 
micro- or ganismes 


23-3-2 


Adresse de institution de depot 


FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 


23-3-3 


Date du depdt 


01 Decembre 2004 (01.12.2004) 


23-3-4 


Numero d'ordre 


CNCM 1-3333 


23-4 


Indications supplementaires 


En ce qui conceme les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant . 




Etats designes pour lesquels les 
Indications sont donnees 


de toutes les designations 


24 


Les indications cl-dessous ont trait 
biologique vise dans ta description : 




24-1 


page 


15 


24-2 


ligne 


24 


Z4-J 


identification du depot 




24-3-1 


Nom de ('institution de dep6t 


CNCM Collection nationale de cultures de 


24-3-2 


Adresse de ['institution de depdt 


micro - or ganismes 

FR- Institut Pasteur, 28, rue du Dr 
Roux, F-75724 Paris Cedex 15 


24-3-3 


Date du depdt 


01 Decembre 2004 (01.12.2004) 


24-3-4 


Numero d'ordre 


CNCM 1-3334 


24-4 


indications supplementaires 


En ce qui conceme les designations dans 
lesquelles un Brevet est demande, le 






micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant . 






24-5 


Etats designes pour lesquels les 
indications sont donnees 


de toutes les designations 
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25 

25-1 
25-2 


Les indications cl-dessous ont trait 

nil tntrrA^manlcma /mi onfro mat^riol 

ou iiiii«ru-wr ycti i loiiit? on duu w iiiamrim 

biologique vise dans la description : 
page 

ligne 


15 
25 
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En ce qui concerne les designations dans 
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En ce qui concerne les designations dans 
lesguelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a un expert designe par le 
requerant . 
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En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
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En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
micro-organisme depose ne sera 
accessible que par la remise d'un 
echantillon a tin expert designe par le 
requerant . 
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En ce qui concerne les designations dans 
lesquelles un Brevet est demande, le 
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